标签
作者提出了一种全新的多智能体编排方法,通过 MCP 将项目计划作为共享控制平面,使 ChatGPT、Claude 等 AI 智能体能够以团队成员身份工作,进行任务分配并设置人工审批关卡。
本文证明,将代理工作流程序编译到小型微调模型的权重中,与上下文基线相比,实现了接近前沿的质量,成本降低128至462倍,解决了质量、成本和灵活性的感知障碍。
作者认为单一巨型代理无法有效运营公司,并描述了他们在Matrix中的方法,这是一种自主工作操作系统,将代理组织成工作区大脑、部门负责人和带有验证循环的范围限定工作者。
GitHub的开源星期五活动将介绍@aspiredotdev,这是一个代码优先的编排与可观测性层,适用于分布式应用,内置日志、追踪和指标仪表板。
本文通过贝叶斯控制器将编码代理的编排形式化为成本敏感的序贯假设检验,该控制器动态决定何时收集证据、细化、验证或停止。在六个生成器和九个基准测试上的实验表明,当验证成本高昂且批评者信息丰富但不完美时,贝叶斯控制最为有价值。
Sakana AI 发布 Fugu,一个仅 0.6B 参数的多智能体编排系统,通过智能任务拆分和模型协作达到前沿性能,绕开了传统的参数量扩增路径,标志着多智能体编排正式成为可用的生产力工具。
Sakana 的 Fugu Ultra 模型编排系统在交易终端 UI 的实时编码测试中表现优于其他模型,尽管成本高出 17 倍,但展示了其在视觉精美度和多智能体协调方面的优势。
Sakana AI 发布了 Fugu Ultra,这是一种多智能体编排模型,在避免出口管制的同时,其性能媲美 Fable 和 Mythos 的前沿水平。
Sakana Fugu是一个多智能体编排系统,据报道其性能与成熟系统Fable和Mythos相当。
Sakana AI 发布了 Fugu Ultra,这是一个编排层,通过统一的 OpenAI 兼容端点将子任务路由到多个模型,性能与领先系统相当。
Sakana AI 发布了 Fugu Ultra,这是一个多智能体编排系统,可通过单一模型 API 访问,其性能与 Fable 和 Mythos 模型相当。
Sakana AI 发布了 Sakana Fugu,这是一个多智能体编排系统,可通过单一模型 API 访问,其中 Fugu Ultra 模型在无出口管制风险的情况下达到了前沿性能。
本文分享了构建实时语音AI代理的宝贵经验,强调了正确的轮流发言、VAD处理、计费意识以及避免回声循环的重要性。
Skill-MAS提出了一种在无需修改模型权重的情况下,为多智能体系统演化元技能以提升编排能力的方法,实现了跨任务和LLM的可迁移性能提升。
本文评估了多智能体编排架构(DAG Plan and Execute、ReAct)在企业规模下的表现,并引入了一个任务管理器以实现持续的事件驱动操作,展示了在延迟和正确性方面的改进。
关于运行AI代理所需基础设施缺失的讨论,包括监控、权限、恢复和审计追踪,质疑这是否会成为新的基础设施类别。
作者搭建了一个名为 Glomz 的平台,在该平台中,具有不同能力的 AI 智能体在竞技场环境中互相审查代码。实验揭示了诸如评审级联和跨模型洞察等涌现行为,但也暴露了编排和参与率方面的挑战。
讨论AI社交应用从文字聊天到实时视频交互的演变,重点介绍了Mel的多模态交互栈以及延迟、唇形同步和协调等技术挑战。
该推文描述了AI智能体系统的四层复利栈结构:底层原语(Fable 5、子智能体、worktree)、编排层(目标循环、动态工作流、云端Routines)、记忆层(状态文件、Skills、知识库)和顶层自我改进(视觉自检、评估循环、规则蒸馏)。