causal-probing

#causal-probing

忠实还是虚构？LLM评审中合理化偏见的因果框架

arXiv cs.CL ↗ · 2026-05-26 缓存

本文提出了一个因果框架，用于量化LLM评审中的合理化偏见，即判决和解释受非证据性线索而非底层文本的影响。该框架提出了线索干预、锚定度量以及Proof-Before-Preference缓解协议，展示了改进的线索不变性。

0 人收藏 0 人点赞

#causal-probing

arXiv cs.AI ↗ · 2026-05-08 缓存

本文提出了一种用于探测多模态大语言模型内部视觉表征的因果框架，揭示了实体与抽象概念在编码方式上的差异。研究强调增加模型深度对于编码抽象概念至关重要，并揭示了当前多模态大语言模型在感知与推理之间的脱节。

0 人收藏 0 人点赞