latent-reasoning

标签

Cards List
#latent-reasoning

为什么将残差流限制在层而非令牌?用于连续潜在推理的持久记忆

arXiv cs.AI · 15小时前 缓存

本文识别了CoCoNuT潜在推理范式中的'概念瓶颈',即隐藏状态在多次传递中被覆盖,并提出了AGCLR,该方法添加了门控持久记忆流以保留中间事实。在GSM8K、HotpotQA和ProsQA上使用GPT-2进行评估,结果显示一致性改进,尤其是在多跳任务上。

0 人收藏 0 人点赞
#latent-reasoning

LLM推理研究中的奇怪现象:我们正在尝试去除思维链痕迹

Reddit r/artificial · 4天前

本文讨论了LLM推理研究的一个转变:从通过思维链使推理显式化,转向探索无需语言痕迹的潜在推理,质疑可见性对于有效推理是否必要。

0 人收藏 0 人点赞
#latent-reasoning

MIRAGE:具备隐式推理与生成式世界模型的移动智能体

arXiv cs.AI · 5天前 缓存

MIRAGE 是一个面向移动端 GUI 智能体的框架,它以紧凑的连续潜在表示取代冗长的思维链推理,并融入生成式世界模型视角,在执行操作前预测未来的屏幕状态。在 AndroidWorld 和 AndroidControl 基准测试中,该框架在减少超过 75% 生成 token 的同时,实现了具有竞争力或更优的性能表现。

0 人收藏 0 人点赞
#latent-reasoning

基于归一化流的潜在推理

Hugging Face Daily Papers · 5天前 缓存

提出NF-CoT,一种使用归一化流来建模LLMs中连续思维的潜在推理框架,保留了自回归优势,并以更低的成本实现了更好的代码生成性能。

0 人收藏 0 人点赞
#latent-reasoning

自适应潜在智能体推理

arXiv cs.CL · 6天前 缓存

本文介绍了自适应潜在智能体推理(ALAR),一种针对LLM智能体的双模式框架,它使用紧凑的潜在推理处理常规轮次,并选择性地升级为显式思维链以应对更困难的决策,实现了高达84.6%的令牌减少,同时保持任务准确性。

0 人收藏 0 人点赞
#latent-reasoning

LaSR:基于潜在推理的上下文感知语音识别

arXiv cs.CL · 2026-06-02 缓存

LaSR提出了一种针对上下文感知语音识别的潜在推理训练范式,围绕声学特征对齐思维链监督,以在无额外延迟的情况下提高术语识别能力,在Fun-Audio-Chat上优于标准微调。

0 人收藏 0 人点赞
#latent-reasoning

几何潜在推理促使LLM生成更短文本

Hugging Face Daily Papers · 2026-06-01 缓存

几何潜在推理(GLR)为LLM中的潜在推理引入了一种几何路径近似方法,能够在数学推理基准上保持准确性的同时实现更短的生成。

0 人收藏 0 人点赞
#latent-reasoning

语义步骤预测:通过步骤采样实现LLM推理轨迹中的多步潜在预测

Reddit r/LocalLLaMA · 2026-05-31 缓存

本文介绍了语义步骤预测,该方法在推理步骤边界而非随机令牌位置上应用几何正则化,在ProcessBench上相比固定基线实现了168倍的多步潜在预测提升。

0 人收藏 0 人点赞
#latent-reasoning

具备潜在推理能力的鲁棒高效护栏

arXiv cs.AI · 2026-05-29 缓存

CoLaGuard 是一种新型护栏模型,它将多步安全推理转移到连续潜在空间中,与显式推理基线相比,实现了 12.9 倍的加速和 22.4 倍的 Token 缩减,同时在十个安全基准上匹配宏 F1 性能。

0 人收藏 0 人点赞
#latent-reasoning

基于Miller指数的潜变量晶体学断裂面推理与视觉-语言模型

arXiv cs.LG · 2026-05-21 缓存

本文研究多模态大语言模型(MLLMs)是否能够利用Miller指数作为潜变量表示,从视觉输入推理晶体学断裂几何,评估其推断物理有效平面假设的能力,并判断该表示在陶瓷、玻璃、金属和混凝土等材料中的适用性。

0 人收藏 0 人点赞
#latent-reasoning

TTE-Flash:通过先思后嵌入令牌加速基于推理的多模态表示

arXiv cs.AI · 2026-05-19 缓存

论文介绍了TTE-Flash,一种用潜在思考令牌替换显式思维链推理的方法,以恒定推理成本生成推理感知的多模态表示,在MMEB-v2基准测试上优于显式CoT基线。

0 人收藏 0 人点赞
#latent-reasoning

通过多准则潜在推理的编码代理上下文剪枝

arXiv cs.AI · 2026-05-18 缓存

LaMR 提出了一种针对编码代理的结构化剪枝框架,将代码相关性分解为语义证据和依赖支持两个维度,使用专用的条件随机场和混合专家门控机制,在保持或提升任务性能的同时,最多可减少 31% 的 Token 使用量。

0 人收藏 0 人点赞
#latent-reasoning

语言模型何时做出决策?关于前语言化承诺的有限答案理论

arXiv cs.AI · 2026-05-11 缓存

本论文提出了一种有限答案理论,用于分析语言模型在输出文本之前何时对答案做出承诺。作者使用 Qwen3-4B-Instruct 演示,答案偏好在最终输出生成之前已显著稳定下来,这为理解潜在推理过程和模型内部状态提供了见解。

0 人收藏 0 人点赞
#latent-reasoning

LatentRAG:用于高效智能体 RAG 的潜在推理与检索

arXiv cs.CL · 2026-05-08 缓存

LatentRAG 是一个新颖的框架,将智能体 RAG 的推理与检索过程转移至连续的潜在空间,在保持与显式方法相当的性能的同时,将推理延迟降低了约 90%。

0 人收藏 0 人点赞
#latent-reasoning

大规模推理模型(尚)不是多语言潜在推理器

arXiv cs.CL · 2026-04-20 缓存

本文研究了大规模推理模型在11种语言上的多语言潜在推理能力,发现虽然存在潜在推理能力,但分布不均——在资源丰富的语言中较强,在低资源语言中较弱。研究发现,尽管表面存在差异,但内部推理机制在很大程度上与英语中心的路径保持一致。

0 人收藏 0 人点赞
#latent-reasoning

OneVL:基于视觉语言解释的单步隐式推理与规划

Hugging Face Daily Papers · 2026-04-20 缓存

# 论文页面 - OneVL:基于视觉语言解释的单步隐式推理与规划 来源:[https://huggingface.co/papers/2604.18486](https://huggingface.co/papers/2604.18486) 发布于 4月20日 [\#1 每日论文](https://huggingface.co/papers/date/2026-04-21) 作者:, , , , , , , , , , , , , , , , , , , , ## 摘要 OneVL 提出了一个统一的视觉-语言-行动框架,通过整合语言和 v

0 人收藏 0 人点赞
← 返回首页

提交意见反馈