prompt-repetition

标签

Cards List
#prompt-repetition

PARTREP:学习在仅解码器LLM中重复什么

arXiv cs.CL · 2天前 缓存

PartRep提出了一种针对仅解码器LLM的选择性提示重复方法,仅追加最有信息量的令牌(通过NLL选择),而非完整提示,从而减少KV缓存和预填充FLOPs,同时在多个基准测试上保留大部分准确率提升。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈