positional-bias

#positional-bias

通过层特定位置嵌入缩放缓解Transformer中的位置偏差

arXiv cs.CL ↗ · 2026-06-29 缓存

介绍LPES，一种层特定位置嵌入缩放方法，通过使用贝塞尔曲线的遗传算法为每层分配不同的缩放因子，缓解LLM中的“中间丢失”问题，无需微调或增加延迟即可实现高达11.2%的准确率提升。

0 人收藏 0 人点赞

#positional-bias

LLM裁判存在暗电流：用于LLM-as-a-Judge评估的心理测量数据表

arXiv cs.CL ↗ · 2026-06-16 缓存

本文介绍了一种心理测量数据表协议，用于将LLM裁判作为测量工具进行评估，测量暗电流、位置虚假偏好、稳定交叉敏感性和目标敏感性。基于三个开放权重模型的案例研究揭示了裁判质量和行为的显著差异。

0 人收藏 0 人点赞

#positional-bias

多视频摘要中多模态大语言模型位置偏差的系统性评估

arXiv cs.CL ↗ · 2026-06-04 缓存

吉林大学研究人员对多模态大语言模型（MLLMs）在多视频摘要任务中的位置偏差进行了系统性评估，基于 ActivityNet 和新闻视频构建了评测基准，并采用覆盖率、方向性位置偏差（DPB）和中间-边缘差距（MEG）等指标对九个模型进行了全面评估。结果表明，位置效应因领域和模型而异，且增加视觉输入或生成预算并不能统一消除这种不平衡现象。

0 人收藏 0 人点赞

#positional-bias

读出捷径：位置数字复制主导小型语言模型中的算术CoT读出

arXiv cs.LG ↗ · 2026-05-25 缓存

本文发现了一种‘位置复制’捷径：小型语言模型通过复制答案分隔符前的最后一个数字来回答算术问题，绕过了实际推理。该效应解释了为何打乱CoT步骤仍能保持性能；在GSM8K上，它占1-3B模型教师强制准确率的89-92%。

0 人收藏 0 人点赞

#positional-bias

双层引导的自描述结构化数据：大规模 LLM 知识导航中精准检索的轻量级 RAG 替代方案

arXiv cs.CL ↗ · 2026-04-23 缓存

SDSR 提出轻量级自描述结构化数据，并辅以双层引导，利用 LLM 的首位偏差，在无向量数据库的情况下实现 100% 路由准确率。

0 人收藏 0 人点赞

positional-bias

通过层特定位置嵌入缩放缓解Transformer中的位置偏差

LLM裁判存在暗电流：用于LLM-as-a-Judge评估的心理测量数据表

多视频摘要中多模态大语言模型位置偏差的系统性评估

读出捷径：位置数字复制主导小型语言模型中的算术CoT读出

双层引导的自描述结构化数据：大规模 LLM 知识导航中精准检索的轻量级 RAG 替代方案

提交意见反馈