collaborative-reasoning

标签

Cards List
#collaborative-reasoning

CrowdMath: 一个众包数学研究讨论数据集

arXiv cs.AI · 2026-06-08 缓存

介绍了CrowdMath,一个包含164条专家标注的进展链条的数据集,来自MIT PRIMES–AoPS CrowdMath项目,捕捉了协作数学问题解决过程。对六个前沿模型进行基准测试,发现它们在下一帖子预测上达到83-88%的准确率,但在帖子角色分类上仅有0.42的macro-F1,突显了在理解协作进展方面的差距。

0 人收藏 0 人点赞
#collaborative-reasoning

诊断资源受限视觉智能体中共享状态协作的失效模式

arXiv cs.AI · 2026-06-01 缓存

本文研究了资源受限视觉智能体中共享状态协作推理的失效模式,引入了CoSee审计框架,该框架形式化了读写验证循环。研究发现,简单的共享工作区可能会放大幻觉,并识别出噪声增强和策略崩溃是主要的失效模式。

0 人收藏 0 人点赞
#collaborative-reasoning

递归多智能体系统

Papers with Code Trending · 2026-04-28 缓存

本文提出RecursiveMAS,一种将递归扩展原则应用于多智能体系统的框架,以提升协作推理的效率和准确性。与标准基线相比,该框架在多个基准测试中实现了显著的加速和token缩减。

0 人收藏 0 人点赞
#collaborative-reasoning

LACE: 用于跨线程探索的格子注意力机制

arXiv cs.AI · 2026-04-20 缓存

LACE 引入了一种格子注意力机制,使LLM中的并发推理路径能够在推理过程中共享中间结果并相互纠正错误,相比标准的独立并行采样,推理准确度提高了7个多百分点。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈