标签
Sakana AI 发布 Fugu,一个仅 0.6B 参数的多智能体编排系统,通过智能任务拆分和模型协作达到前沿性能,绕开了传统的参数量扩增路径,标志着多智能体编排正式成为可用的生产力工具。
Sakana 的 Fugu Ultra 模型编排系统在交易终端 UI 的实时编码测试中表现优于其他模型,尽管成本高出 17 倍,但展示了其在视觉精美度和多智能体协调方面的优势。
Sakana Fugu是一个多智能体编排系统,据报道其性能与成熟系统Fable和Mythos相当。
这篇推文介绍了Claude Code Dynamic Workflows的9步指南,强调了结构化循环和多智能体工作流的最佳实践,包括人工审查、工作树隔离和自动返工,指出这是将agent swarm从玩具变成生产力的关键。
文章回顾了OpenClaw Agent框架的设计亮点与不足,并阐述了作者设计更好的Agent框架FastClaw的经验总结,强调云原生、轻量、多租户等原则。
一份关于生产系统中15种AI智能体设计模式的全面指南,阐述了每种模式的使用时机和常见陷阱。
Sakana AI 发布了 Fugu Ultra,这是一个多智能体编排系统,可通过单一模型 API 访问,其性能与 Fable 和 Mythos 模型相当。
Elie Bakouch 批评 Sakana AI 的 Fugu 系统是一个建立在闭源模型之上的闭源编排层,认为它缺乏透明度和真正的人工智能主权,并在路由和成本效率方面存在技术限制。
Sakana AI 发布了 Sakana Fugu,这是一个多智能体编排系统,可通过单一模型 API 访问,其中 Fugu Ultra 模型在无出口管制风险的情况下达到了前沿性能。
Sakana Fugu 通过单一 API 动态编排多种顶级模型,以处理复杂的多步骤任务。它利用其在 ICLR 2026 论文中提出的学习型编排方法,实现了前沿水平的性能,同时避免了对单一供应商的依赖。
本文分享了构建实时语音AI代理的宝贵经验,强调了正确的轮流发言、VAD处理、计费意识以及避免回声循环的重要性。
一位开发者在4天内为黑客马拉松构建了一个由6个智能体组成的卫星碰撞规避AI系统,并分享了经验教训。
本文评估了多智能体编排架构(DAG Plan and Execute、ReAct)在企业规模下的表现,并引入了一个任务管理器以实现持续的事件驱动操作,展示了在延迟和正确性方面的改进。
提出了多智能体交易记忆(MATM)框架,用于在种群级别存储和检索智能体生成的轨迹,以提高任务性能并减少交互步骤,适用于ALFWorld和WebArena等交互环境。
AgentFinVQA是一个多代理管道,用于金融图表问答,它将查询分解为规划、OCR、图例确认、视觉检查和验证步骤,并将每一步记录在可追溯的模型评估包中。与零样本基线相比,它实现了显著的准确性提升,同时支持本地部署和可审计性。
本文把多智能体LLM商议建模成一个闭环动力系统,其中每个智能体都拥有隐藏的内部信念(锚点),该锚点持续牵引其观点。文章展示了如何仅从商议数据中恢复这个锚点,并解释了诸如观点逃逸初始信念凸包等现象。
一个独立构建的多智能体认知架构,使用庞加莱球流形上的双曲几何、变分自由能进行信念更新、以及波干涉进行记忆检索,使个性从记忆交互中涌现而非通过脚本定义。
AgentHub 是一个本地优先的多智能体协作桌面应用,将 AI 协作做成聊天体验,支持任务分发、文件审查和人工审批,基于 Next.js 和 Electron 构建。
Google Gemma 团队为 Gemma 4 26B 发布了一个演示,可在本地以每秒100+ tokens 的速度运行10个并行智能体,能够执行诸如编写SVG画廊代码和并行翻译等任务,全部免费且开源。
本文通过行为特征和消融实验,研究了流程层面的协调控制(领导力)何时对多智能体大语言模型团队有益。研究发现,领导力仅在特定条件下(初始共识不可靠、任务可恢复、无指导交互不足)提升准确性,这与团队科学中的权变理论一致。