parallel-reasoning

#parallel-reasoning

CAPS：级联自适应成对选择实现高效并行推理

arXiv cs.AI ↗ · 2026-05-18 缓存

CAPS 引入了一个级联自适应选择框架，用于高效并行推理，在多个大语言模型基准测试中，将验证器计算成本降低了 75% 以上，同时性能优于现有的成对验证方法。

0 人收藏 0 人点赞

#parallel-reasoning

HeavySkill：作为智能体驾驭内在技能的深度思考

Papers with Code Trending ↗ · 2026-05-04 缓存

HeavySkill 是一个新框架，通过并行推理和总结阶段，将复杂推理内化为模型的内在技能，其表现优于传统的编排方法，并通过强化学习实现了大语言模型的自我演进。

0 人收藏 0 人点赞

#parallel-reasoning

@HuggingPapers：并行推理及时止损——STOP 通过读取 KV-cache 状态提前剪枝注定失败的轨迹，…

X AI KOLs Timeline ↗ · 2026-04-21 缓存

STOP 方法利用 KV-cache 状态提前剪枝注定失败的推理轨迹，token 用量降 70%，在 1.5B–20B 模型上提升 AIME 与 GPQA 准确率。

0 人收藏 0 人点赞

#parallel-reasoning

早期剪枝学习！高效并行推理的路径剪枝方法

arXiv cs.CL ↗ · 2026-04-20 缓存

本文提出了 STOP（SuperTOken for Pruning），一个系统框架，用于在大型推理模型的并行推理中早期剪枝低效推理路径。该方法在 1.5B 到 20B 参数的模型中实现了优异的效率和效果，在固定计算预算下将 GPT-OSS-20B 在 AIME25 上的准确率从 84% 提升到 90%。

0 人收藏 0 人点赞

parallel-reasoning

CAPS：级联自适应成对选择实现高效并行推理

HeavySkill：作为智能体驾驭内在技能的深度思考

@HuggingPapers：并行推理及时止损——STOP 通过读取 KV-cache 状态提前剪枝注定失败的轨迹，…

早期剪枝学习！高效并行推理的路径剪枝方法

提交意见反馈