标签
文章讨论了在多智能体系统中管理工具访问的挑战,其中并行执行可能导致竞态条件和协调问题,从而产生不一致的结果。
本文提出了一种多智能体计算机使用 (MACU) 系统,该系统使用管理者模型将任务分解为有向无环图,供子智能体并行执行。在多个基准测试上,它相比单智能体基线有一致的改进,并展现出更好的测试时扩展能力。
介绍 pi-dynamic-workflows,一个让 LLM 通过生成 JavaScript 脚本动态编排多个子代理并行执行任务的工具,适用于代码审计、大型重构等场景。
Anthropic 发布了具有动态工作流(Dynamic Workflows)功能的 Claude Opus 4.8,支持并行任务执行,并改进了判断能力,可标出不确定性,从而从工具转变为协作者。
Aigon 是一款开源工具,可在同一功能上并行运行多个 AI 编码智能体(功能通过 Markdown 规范定义),并使用 LLM 评审选出最佳实现,配备可视化看板和可选调度功能。
MobileGym是一个基于浏览器的移动GUI代理研究仿真平台,具有确定性状态评估和可扩展的并行执行功能。它包含一个包含416个任务的基准测试,并展示了在Qwen3-VL-4B上使用GRPO带来的提升。
multi-cli 是一款工具,支持同时运行多个AI编程代理(如 Claude Code、Codex、Gemini CLI、Cursor),并为每个代理提供独立配置文件,从而实现并行的代理式编程工作流。
Superset 是一个开源IDE,用于并行编排多个基于CLI的AI编码智能体,具有隔离的git工作树、内置监控和差异查看器。它支持多种智能体,如Claude Code、Codex CLI和Gemini CLI。