collaborative-reasoning

#collaborative-reasoning

CrowdMath: 一个众包数学研究讨论数据集

arXiv cs.AI ↗ · 2026-06-08 缓存

介绍了CrowdMath，一个包含164条专家标注的进展链条的数据集，来自MIT PRIMES–AoPS CrowdMath项目，捕捉了协作数学问题解决过程。对六个前沿模型进行基准测试，发现它们在下一帖子预测上达到83-88%的准确率，但在帖子角色分类上仅有0.42的macro-F1，突显了在理解协作进展方面的差距。

0 人收藏 0 人点赞

#collaborative-reasoning

诊断资源受限视觉智能体中共享状态协作的失效模式

arXiv cs.AI ↗ · 2026-06-01 缓存

本文研究了资源受限视觉智能体中共享状态协作推理的失效模式，引入了CoSee审计框架，该框架形式化了读写验证循环。研究发现，简单的共享工作区可能会放大幻觉，并识别出噪声增强和策略崩溃是主要的失效模式。

0 人收藏 0 人点赞

#collaborative-reasoning

递归多智能体系统

Papers with Code Trending ↗ · 2026-04-28 缓存

本文提出RecursiveMAS，一种将递归扩展原则应用于多智能体系统的框架，以提升协作推理的效率和准确性。与标准基线相比，该框架在多个基准测试中实现了显著的加速和token缩减。

0 人收藏 0 人点赞

#collaborative-reasoning

LACE: 用于跨线程探索的格子注意力机制

arXiv cs.AI ↗ · 2026-04-20 缓存

LACE 引入了一种格子注意力机制，使LLM中的并发推理路径能够在推理过程中共享中间结果并相互纠正错误，相比标准的独立并行采样，推理准确度提高了7个多百分点。

0 人收藏 0 人点赞

collaborative-reasoning

CrowdMath: 一个众包数学研究讨论数据集

诊断资源受限视觉智能体中共享状态协作的失效模式

递归多智能体系统

LACE: 用于跨线程探索的格子注意力机制

提交意见反馈