causal-intervention

标签

Cards List
#causal-intervention

拆解病态捷径:用于忠实LVLM解码的因果框架

arXiv cs.AI · 2天前 缓存

本文揭示了大视觉语言模型中的幻觉是由一种动态结构错位引起的,其中某些注意力头充当风险中介,与视觉证据解耦,转而锁定语言先验。作者提出了Fox,一种无需训练的因果干预框架,能够诊断并物理切断这些病态捷径,在忠实解码中实现了最先进的性能。

0 人收藏 0 人点赞
#causal-intervention

权重范数确定Grokking时间尺度:一个因果延迟定律

arXiv cs.LG · 2026-06-15 缓存

本文证明权重范数因果性地控制神经网络中grokking的时间尺度,调和了相互矛盾的论述。通过干预实验,它表明grokking遵循指数延迟定律,且范数大小在不同架构中比学习率更主导grokking时间。

0 人收藏 0 人点赞
#causal-intervention

模态冲突幻觉中注意力头不平衡的因果证据

arXiv cs.AI · 2026-05-20 缓存

本文识别了MLLMs中不平衡的注意力头组,这些头组驱动或抵抗模态冲突幻觉,并提出了MACI(模态冲突感知因果干预),一种仅在检测到冲突时抑制幻觉驱动头的因果干预方法,在五个模型上实现了大幅的幻觉减少。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈