标签
演示了一个多智能体工作流:Codex 构建代码,Claude Code 进行审查,Hermes 管理协调工作,所有流程均通过看板(Kanban)进行跟踪。
Hermes Agent 已更新为可充当 Claude Code 和 Codex 的协调器,允许用户通过统一的看板追踪进度。
ToolCUA 是一个全新的代理框架,通过分阶段训练和强化学习,优化计算机使用代理的 GUI-工具路径选择。它通过在 GUI 操作和高级工具调用之间进行有效交替,在 OSWorld-MCP 上达到了最先进的性能。
一个新的开源项目介绍了一个自托管的、语音优先的 macOS 多智能体编排系统,该系统使用 Claude Code 作为执行运行器。其设置采用新颖的父子结构,并带有一个看门狗层,以防止智能体之间的无尽审查循环。
本文介绍了自我编程执行(SPE),这是一种代理架构,其中语言模型生成其自身的编排程序,而非依赖固定的外部框架。文章提出了“Spell”,一种基于 Lisp 的语言,支持自我编辑和重新求值,并展示了前沿模型能够利用该方法成功执行代理任务。
本文探讨了 AI 工程中 ReAct 和 CodeAct 两种编排范式的利弊,强调了 CodeAct 在处理复杂任务时的高效性,并介绍了一个新的开源框架。
Sakana AI 发布了一个多代理编排系统(Multi-Agent Orchestration System),它通过一个小模型智能协调 GPT、Claude 和 Gemini 等前沿大模型来自主分配任务和处理复杂工作。
作者认为,当前的 AI Agent 评估往往忽视了执行效率,仅关注最终输出,而忽略了在生产环境中出现的冗余操作以及昂贵的编排问题。
一位开发者分享了使用AI编排框架(LangGraph, CrewAI, AutoGen)的真实体验,指出了原型设计便捷性与生产可靠性之间的权衡,并向社区询问如何处理失败、人机协同和Token成本问题。
讨论多智能体LLM系统中固定角色与动态生成之间的权衡,基于搭建多智能体设置的个人经验。探讨显式专家何时有益,何时增加不必要的仪式感。
本文介绍了 RGAO,这是一种用于多智能体代码生成的检索引导自适应编排框架,可根据代码复杂度动态选择拓扑结构。它提供了一种形式化的预算代数,在显著降低相较于基线方法的路由错误率的同时,确保了资源的可证明守恒。
本文讨论了AI代理工作流如何将优化重心从单纯的推理成本转向更广泛的挑战,如延迟、编排开销和可靠性。文章强调了向混合架构和动态模型路由发展的趋势,以应对这些多步骤工作流的复杂性。
文章讨论了AI代理从沙盒测试迁移到生产环境时可靠性下降的问题,指出编排层包含的错误往往比模型本身更多。
一款名为"orchestrate"的工具,允许用户通过插件命令运行由多个规划器、验证器和工作节点组成的 AI 智能体集群。
Kubernetes v1.36 "Haru" 携 70 项增强正式发布,其中 18 项进入稳定版,25 项进入 Beta,25 项为 Alpha,同时包含若干弃用与移除。
Agent-flow adds real-time visualization to Claude Code, letting developers watch agent reasoning, branching, coordination and cost as tasks run.
Netomi 分享了在企业环境中扩展智能体 AI 系统的实践经验,利用 GPT-4.1 和 GPT-5.2 在受监管的执行层中处理复杂的多步骤工作流,服务于联合航空和 DraftKings 等财富500强客户。该公司展示了如何通过合适的提示词模式、并发设计和上下文推理,在生产规模上实现可靠的 AI 智能体部署。
OpenAI 推出了一系列用于构建智能体的新工具,包括 Responses API、内置工具(网络搜索、文件搜索、计算机使用)、Agents SDK 和可观测性功能,旨在简化智能体应用程序开发。
Paperclip 是一款开源的多智能体编排系统,可在 VPS 上 7×24 小时运行 AI 驱动公司,通过类 GitHub Issue 工作流,让不同角色的智能体完成研究、写作、编辑等任务。