latent-reasoning

#latent-reasoning

@burny_tech: 隐式推理综述 "大型语言模型(LLMs)展现了令人印象深刻的推理能力，尤其是……

X AI KOLs Timeline ↗ · 昨天缓存

本综述全面概述了LLM中的隐式推理，探讨了在连续隐藏状态中执行多步推理且无需显式token级监督的方法。

0 人收藏 0 人点赞

#latent-reasoning

@ZhihuFrontier: 半年前，一位知乎答主预测下一个Transformer将吸收循环、递归状态、稀疏路由……

X AI KOLs Timeline ↗ · 3天前缓存

一位知乎答主半年前的预测——下一个Transformer将吸收循环、递归状态、稀疏路由和潜在推理——随着Loop Engineering的推进，正变得越来越有现实意义。本文探讨了未来的Transformer架构如何演变为混合模型：将线性复杂度的层用于背景上下文，注意力机制用于精确推理，再加上更细粒度的稀疏性和原生的System 2推理。

0 人收藏 0 人点赞

#latent-reasoning

IV-CoT: 隐式视觉思维链用于结构感知的文本到图像生成

Hugging Face Daily Papers ↗ · 6天前缓存

IV-CoT 将视觉条件分解为结构和语义级联，以改进结构感知的图像生成，使用仅训练阶段的草图监督来指导结构查询。在 GenEval 和 T2I-CompBench 上达到了最先进的结果。

0 人收藏 0 人点赞

#latent-reasoning

@machinestein: ICML 2026：TRMs中的潜在推理实际上是策略改进算子为什么递归推理，尤其是…

X AI KOLs Timeline ↗ · 2026-06-16 缓存

论文揭示了基于transformer的推理模型（TRMs）中的潜在推理实际上充当了策略改进算子，并提出了一种算法，将学习和推理效率提升高达18倍。

0 人收藏 0 人点赞

#latent-reasoning

SuperThoughts：叠加态中的推理令牌

arXiv cs.LG ↗ · 2026-06-15 缓存

SuperThoughts 将连续的思维链令牌压缩为潜在表示，并每步解码两个令牌，在数学推理基准上实现了约20-30%的思维链长度缩减，准确率损失极小，同时将推理吞吐量提高了一倍。

0 人收藏 0 人点赞

#latent-reasoning

可观测模式并非解释：隐式推理模型的因果几何分析

arXiv cs.CL ↗ · 2026-06-12 缓存

本文分析了隐式推理模型（LRM），并论证隐状态中的可观测模式并非推理的因果解释；它倡导在可解释性研究中采用匹配对照和因果测试。

0 人收藏 0 人点赞

#latent-reasoning

揭秘隐藏状态递归：基于在策略强化学习的可切换隐式推理

Hugging Face Daily Papers ↗ · 2026-06-11 缓存

SWITCH 是一种可切换隐式推理框架，它使用显式边界标记，通过基于在策略的强化学习实现可训练且可解释的递归隐状态推理，优于先前的方法。

0 人收藏 0 人点赞

#latent-reasoning

为什么将残差流限制在层而非令牌？用于连续潜在推理的持久记忆

arXiv cs.AI ↗ · 2026-06-09 缓存

本文识别了CoCoNuT潜在推理范式中的'概念瓶颈'，即隐藏状态在多次传递中被覆盖，并提出了AGCLR，该方法添加了门控持久记忆流以保留中间事实。在GSM8K、HotpotQA和ProsQA上使用GPT-2进行评估，结果显示一致性改进，尤其是在多跳任务上。

0 人收藏 0 人点赞

#latent-reasoning

LLM推理研究中的奇怪现象：我们正在尝试去除思维链痕迹

Reddit r/artificial ↗ · 2026-06-05

本文讨论了LLM推理研究的一个转变：从通过思维链使推理显式化，转向探索无需语言痕迹的潜在推理，质疑可见性对于有效推理是否必要。

0 人收藏 0 人点赞

#latent-reasoning

MIRAGE：具备隐式推理与生成式世界模型的移动智能体

arXiv cs.AI ↗ · 2026-06-04 缓存

MIRAGE 是一个面向移动端 GUI 智能体的框架，它以紧凑的连续潜在表示取代冗长的思维链推理，并融入生成式世界模型视角，在执行操作前预测未来的屏幕状态。在 AndroidWorld 和 AndroidControl 基准测试中，该框架在减少超过 75% 生成 token 的同时，实现了具有竞争力或更优的性能表现。

0 人收藏 0 人点赞

#latent-reasoning