position-encoding

标签

Cards List
#position-encoding

RoVE:面向相对位置依赖值路径的旋转值嵌入注意力机制

arXiv cs.LG · 2天前 缓存

本文提出RoVE,一种无需参数的旋转位置嵌入改进方法,通过同时旋转值与键使值路径具备位置敏感性,将RoPE注意力转化为注意力卷积。在GPT-2模型上的实验表明,该机制在少样本上下文学习、分布外困惑度及长上下文检索方面持续提升性能。

0 人收藏 0 人点赞
#position-encoding

PJ-RoPE: 一种用于相对注意力的傅里叶-若尔当-仿射位置空间

arXiv cs.LG · 2026-06-05 缓存

PJ-RoPE将RoPE的傅里叶相位、Jordan-RoPE的有限若尔当块和ALiBi的仿射近因性统一到一个可学习的相对位置空间中,并研究了不同任务对该空间区域的选择。

0 人收藏 0 人点赞
#position-encoding

RoPE 在长上下文中既无法区分位置也无法区分词元,可证明

Hugging Face Daily Papers · 2026-05-15 缓存

本文证明,基于RoPE的注意力机制在长上下文中无法区分词元位置和身份,解释了LLM在宣称的上下文长度内失败的原因。实验验证表明,针对检索优化的模型在简单列表任务上表现困难。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈