adaptive-reasoning

#adaptive-reasoning

@jinyuhou0: 在主流基准测试中，我们的30B模型与规模大20-30倍的系统（gpt-5.4-xhigh、DeepSeek-V3.2、Kimi-K2.5）匹敌，而……

X AI KOLs Timeline ↗ · 2026-05-22 缓存

一款新的30B模型在主流基准测试中与规模大20-30倍的系统匹敌，同时相比同类30/32B智能体大语言模型，使用的推理令牌减少高达95%。这是通过一个学习型配置器实现的，该配置器决定何时以及如何进行推理。模型和代码已开放。

0 人收藏 0 人点赞

#adaptive-reasoning

X AI KOLs Timeline ↗ · 2026-05-22 缓存

新研究引入了SR²AM，这是一种自调节何时使用模拟推理的配置器，提升了LLM的效率和性能。

0 人收藏 0 人点赞

#adaptive-reasoning

arXiv cs.CL ↗ · 2026-05-20 缓存

本文介绍了条件熵塑造（CES）框架，该框架动态控制LLM中令牌级别的响应熵，以平衡推理深度和简洁性，在数学基准测试上实现更高的准确率同时缩短响应长度。

0 人收藏 0 人点赞

#adaptive-reasoning

Hugging Face Daily Papers ↗ · 2026-05-10 缓存

LEAD通过使用正确性-效率权衡的在线校准和自适应的问题特定长度目标，在训练过程中动态调整推理效率，提高了数学推理的准确性并减少了输出长度。

0 人收藏 0 人点赞

#adaptive-reasoning

arXiv cs.CL ↗ · 2026-04-21 缓存

研究人员推出了 x1，这是一类推理模型家族，能够针对每个具体实例自适应地选择最优语言进行推理，证实了在多语言及文化相关任务中，语言选择会对推理质量产生影响。

0 人收藏 0 人点赞