标签
一位AI研究人员在多智能体编码系统上进行了13次对照实验,发现依赖排序的协调显著提高了成功率,而角色背景故事没有带来可衡量的益处。
一位Databricks技术负责人认为,多智能体AI系统失败的原因并非模型智能不足,而是缺乏协调。他将50多个智能体视为一个分布式系统问题,其中并行处理容易实现,但保持共享一致性困难重重。
作者构建了 AgentsHive,一个共享工作空间,将多个 AI 代理(如 Claude 和 Codex)协调成一个具有角色、记忆和路由的协作产品团队,让独立开发者无需手动切换不同的代理工作流。
本文介绍了Foundation Protocol,这是一种以图优先的协调层,旨在实现新兴人机社会中可靠的多智能体协作、经济交换和问责制。
Pentagon 是人类与 AI 智能体的协调层,支持跨团队的自主通信与任务管理。这家由 Y Combinator 孵化的初创公司旨在解决多智能体工作流中人类中台的瓶颈问题。
一篇新论文将部分信息分解与时延互信息应用于多智能体大语言模型系统,证明了智能体之间的关系信息是可测量的,且真正的协调既需要分化也需要共同目标,这与组织心理学的研究发现相呼应。
本文发现共享上下文多智能体LLM团队在顺序微调时存在一种结构性失效模式,并将其形式化为复合占位偏移。为此提出了TeamTR,一种信任域框架,通过重采样轨迹并施加每个智能体的散度控制,实现了平均7.1%的性能提升。
本文提出了基于影响的团队引导(IBTS)框架,用于零样本人机协作。该框架通过影响力塑造发现多样化的交互模式,并将轨迹引导至更强的协调方向。在包含两个智能体与三个智能体的Overcooked-AI实验(包括一项30名受试者的人类研究)中,IBTS在团队表现上优于基线方法。
一个用于多智能体系统的高级提示包,可防止智能体遗忘、重复工作或相互矛盾,包含记忆提示、交接模板和工作流程配方。
团队在Claude Code之上构建了一个流程层,以管理工程任务间的上下文和协调,通过确保每一步都提供正确的上下文来提高代码质量。他们将这个问题视为流程/协调问题,而非工具问题。
文章认为多智能体系统需要运行时基础设施层,而非更好的提示,引用了 MiniMax、OpenAI、Google 和 Anthropic 的发布。文章强调了工作者与验证者角色的分离以及多智能体设置的开销成本。
中国在模拟城市作战场景中演示了步兵与科技的协同作战,包括配备步枪的机器狗和无人机。
OpenAI 概述了超级智能治理框架,强调三个关键支柱:领先 AI 开发工作之间的协调、一个国际权威机构(类似 IAEA)监督超过特定能力阈值的系统,以及 AI 安全方面的技术进展和民主公众对最强大系统的监督。