layer-specific

标签

Cards List
#layer-specific

通过层特定位置嵌入缩放缓解Transformer中的位置偏差

arXiv cs.CL · 昨天 缓存

介绍LPES,一种层特定位置嵌入缩放方法,通过使用贝塞尔曲线的遗传算法为每层分配不同的缩放因子,缓解LLM中的“中间丢失”问题,无需微调或增加延迟即可实现高达11.2%的准确率提升。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈