mechanistic-analysis

标签

Cards List
#mechanistic-analysis

LLMs为何在结构化知识上产生幻觉:对线性化表示推理的机制分析

arXiv cs.CL · 2026-05-27 缓存

本文对LLMs在推理线性化结构化知识时产生幻觉的原因进行了机制分析,发现幻觉源于系统的内部动态,例如对捷径线索的关注以及前馈层中语义基础的失败,而非随机噪声。

0 人收藏 0 人点赞
#mechanistic-analysis

上下文学习运作于概念子空间学习

arXiv cs.LG · 2026-05-20

本文提出,大型语言模型中的上下文学习通过低维概念子空间运作,任务相关信息集中在表示空间的一小部分中,并在Llama-3-8B和Qwen2.5-7B上通过实验得到支持。

0 人收藏 0 人点赞
#mechanistic-analysis

视觉-语言模型中提示诱导幻觉的机制研究

arXiv cs.CL · 2026-04-20 缓存

本文通过机制分析研究视觉-语言模型中的提示诱导幻觉,识别出导致模型偏向文本提示而忽视视觉证据的特定注意力头。作者证明了删除这些PIH头可以在无需额外训练的情况下减少至少40%的幻觉,揭示了该故障模式背后的模型特定机制。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈