形式化潜在思维:大语言模型中思维表征的四条公理
摘要
提出了一种用于大语言模型中潜在思维表征的公理化评估框架,揭示当前表征在23个推理任务中无法满足四个基本功能公理(Causality, Minimality, Separability, Stability),表明表征质量存在结构性差距。
查看缓存全文
缓存时间: 2026/06/29 02:00
论文页面 - 将潜在思维形式化:LLM中思维表征的四条公理
来源:https://huggingface.co/papers/2606.27378
摘要
一种公理化的评估框架揭示了LLMs在多种推理任务中潜在思维表征的系统性失败,表明当前表征无法在不同模型架构上一致地满足基本功能公理。
我们为LLMs中的潜在思维表征引入了一个公理化评估框架(https://huggingface.co/papers?q=axiomatic%20evaluation%20framework),该框架包含与下游基准分数无关的指标,并揭示了基准准确率所掩盖的表征失败。现有评估将表征质量与模型能力混为一谈,因此无法将失败归因于表征本身而非处理它的模型。我们将四个功能公理(因果性、最小性、可分离性和稳定性)形式化,并为每个公理定义了定量度量,这些度量直接计算自表征,独立于下游准确率。我们审计了23个推理任务(例如,空间推理、事实问答)上的开放权重LLMs。我们发现,没有候选表征能同时满足所有四个公理;表征能可靠地区分任务类型,但无法区分同一任务内的两个问题;而且表征编码的信息几乎不超过输入嵌入中已有的信息。这种失败在密集模型、推理蒸馏模型和RL训练模型家族中一致存在,表明该差距是结构性的,而非模型规模或训练过程的属性。
查看arXiv页面(https://arxiv.org/abs/2606.27378)查看PDF(https://arxiv.org/pdf/2606.27378)项目页面(https://fard-lab.github.io/formalize-thoughts/)GitHub(https://github.com/fard-lab/formalize-thoughts)添加到集合(https://huggingface.co/login?next=%2Fpapers%2F2606.27378)
在你的agent中获取此论文:
hf papers read 2606\.27378
没有最新的CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用此论文的模型0
没有模型链接此论文
在模型README.md中引用arxiv.org/abs/2606.27378以链接到此页面。
引用此论文的数据集0
没有数据集链接此论文
在数据集README.md中引用arxiv.org/abs/2606.27378以链接到此页面。
引用此论文的空间0
没有空间链接此论文
在空间README.md中引用arxiv.org/abs/2606.27378以链接到此页面。
包含此论文的集合0
没有集合包含此论文
将此论文添加到一个集合(https://huggingface.co/new-collection)中以链接到此页面。
相似文章
LLMs为何在结构化知识上产生幻觉:对线性化表示推理的机制分析
本文对LLMs在推理线性化结构化知识时产生幻觉的原因进行了机制分析,发现幻觉源于系统的内部动态,例如对捷径线索的关注以及前馈层中语义基础的失败,而非随机噪声。
LLM推理研究中的奇怪现象:我们正在尝试去除思维链痕迹
本文讨论了LLM推理研究的一个转变:从通过思维链使推理显式化,转向探索无需语言痕迹的潜在推理,质疑可见性对于有效推理是否必要。
学习细化隐藏状态以实现可靠的LLM推理
提出了ReLAR,一种强化引导的潜在细化框架,在解码前迭代更新LLM中的隐藏表示,与思维链方法相比,提高了推理可靠性和效率。
LGMT:基于逻辑的变形测试用于评估LLM推理可靠性
本文介绍了LGMT,这是一个利用一阶逻辑生成语义不变测试用例以评估LLM推理可靠性的框架。在六个LLM上的实验表明,LGMT暴露了静态基准遗漏的隐藏缺陷,提示评估应侧重于逻辑不变性下的鲁棒性。
LLM推理的周期表:推理范式、方法与失败模式的系统综述
一项综合分析超过300篇关于LLM推理的论文,提出了推理范式的分类体系,包括Chain-of-Thought、Multi-Hop、Mathematical、Commonsense等,并总结了常见的失败模式和研究空白。