介绍 Agent Executor,谷歌的分布式 Agent 运行时(6分钟阅读)

TLDR AI 工具

摘要

谷歌推出 Agent Executor,这是一个开源分布式运行时,用于可靠的长时运行代理工作流,具有持久执行、安全隔离和会话一致性等特点。

Google Agent Executor 是一个开源运行时标准,用于可靠高效地执行长时运行的代理工作流。关键特性如持久执行、安全隔离和连接恢复增强了工作流管理,而会话一致性和轨迹分支支持分布式代理环境。它还与 Kubernetes Engine 在 Agent Substrate 上协作,以优化大规模代理部署的计算效率。
查看原文
查看缓存全文

缓存时间: 2026/05/21 18:14

# Agent Executor:谷歌的分布式Agent运行时 来源:https://cloud.google.com/blog/products/ai-machine-learning/agent-executor-googles-distributed-agent-runtime 随着模型和工具链的不断改进,Agent正在承担越来越复杂的任务,这些任务可能持续运行数小时甚至数天。但随着我们推动Agent做更多事情,一个新的运营问题浮现出来:长时间运行的Agent工作流非常脆弱,在生产环境中难以可靠高效地管理。 今天,我们正式推出 **Agent Executor**,这是谷歌的开源(https://github.com/google/ax)运行时标准,用于Agent的执行、恢复和分布式部署。基于我们在内部解决这些挑战的经验,我们为Agent Executor赋予了以下原生能力: - **持久化执行**:长时间运行需要具备在中断(如人机协同确认)或故障后恢复的能力。Agent Executor通过事件日志和快照机制,为任何参与者(如Agent、Agent工具链、技能、工具或沙箱)自动提供后端韧性。 - **安全隔离**:Agent Executor将组件隔离在天然安全的沙箱中,防止有害副作用,并确保恶意活动无法危及整个服务。当Agent生成代码或同时处理多租户/用户数据时,沙箱尤其有用。 - **会话一致性**:在分布式Agent工作流中,多个组件可能同时尝试更新共享会话状态。Agent Executor内置的单写入者架构有助于保持一致性,降低状态损坏风险。 - **连接恢复**:在长时间运行的Agent执行过程中,客户端可能因网络中断等多种原因断开连接。Agent Executor允许客户端重新连接到Agent,并从客户端最后看到的序列回填响应,以提供更好的用户体验。 - **轨迹分支**:检查点允许你在任意节点分支Agent轨迹(其决策或工作流路径),使Agent能够测试或评估不同路径,而不会丢失上下文或其他状态。 https://storage.googleapis.com/gweb-cloudblog-publish/images/1_agent_executor_EdQVRpG.max-1900x1900.jpg 在这篇博客中,我们将进一步介绍Agent Executor以及如何开始使用。 ### 与谷歌Agent运行时联邦 企业对Agent的采用需要跨部署模型的编排。一些团队需要本地基础设施来满足专有工作流、性能或合规要求,而另一些团队则偏好预构建或自定义的托管Agent,以更快实现价值。在Google I/O大会上,我们推出了一系列新的解决方案——包括Antigravity 2.0(https://antigravity.google/blog/introducing-google-antigravity-2.0)和托管Agent API(https://blog.google/innovation-and-ai/technology/developers-tools/managed-agents-gemini-api)——旨在加速团队在Agent企业中的构建和扩展。 Agent Executor桥接了这些部署模型,允许你混合搭配以下任意或全部选项: - 谷歌的Antigravity(https://antigravity.google/blog/google-io-2026),Gemini最先进的Agent工具链 - 谷歌构建的前沿Agent,例如最新的Deep Research(https://blog.google/innovation-and-ai/models-and-research/gemini-models/next-generation-gemini-deep-research/)Agent - 你自行构建并由谷歌管理的自定义Agent(例如,通过Gemini API中的新托管Agent(https://docs.cloud.google.com/gemini-enterprise-agent-platform/build/managed-agents)) - 使用LangChain/LangGraph、Agent开发工具包(https://adk.dev/)(ADK)等构建的自定义专用Agent,以及任何使用Agent2Agent协议(https://github.com/a2aproject/A2A)(A2A)的Agent https://storage.googleapis.com/gweb-cloudblog-publish/images/2_sDivt9A.max-1900x1900.jpg ### 掌控你的Agent、模型和计算资源 借助Agent Executor,企业可以最大程度地灵活保持对工作负载的主权,并将专有工作流保留在自己管理的计算资源和自定义沙箱中。你的内部开发团队可以更灵活地决定Agent的部署和管理方式,并受益于: - **防止供应商锁定**:将Agent部署在自己的基础设施上,无需绑定到特定供应商的模型或计算环境。这允许完全控制数据驻留以及你的成本和预算控制。 - **自带工具链和Agent**:Agent Executor设计为与工具链无关,允许你自带或使用其他供应商提供的工具链。它还支持使用行业标准框架和协议开发的Agent,提供了一个广泛的兼容Agent生态系统。 - **完全控制执行**:Agent Executor允许开发者直接在自己的数据平面上运行整个Agent堆栈,包括MCP、技能和其他Agent。开发者可以选择任何计算资源,并设置自定义隔离边界和工作负载策略执行。 ### 在Kubernetes上通过Agent优先的计算层扩展Agent规模 随着Agent工作负载扩展到数亿级别并变得越来越长时间运行,我们的客户正在触及传统计算抽象的极限,因为与传统软件不同,Agent是非线性程序,需要等待外部输入。为解决这个问题,我们与Google Kubernetes Engine团队合作推出了Agent Substrate(https://cloud.google.com/blog/products/containers-kubernetes/bringing-you-agent-sandbox-on-gke-and-agent-substrate),这也是今天同时宣布的一个新的开源项目。 Agent Substrate为Kubernetes引入了新的抽象层,能够实时将Agent移动到可用的计算容量上或移出,从而以更高的规模和效率实现更低的延迟。标准Kubernetes针对处理数千个长时间运行的服务进行了优化,而Agent Substrate则设计用于处理数百万次亚秒级工具调用(这些调用如果在标准控制平面上处理会不堪重负)。Agent Substrate将现有沙箱基础设施的核心安全运行时和快照能力与一个极简的控制平面相结合,该控制平面旨在绕过Kubernetes的部分限制,而无需重新发明其他部分。这些层协同工作,使你能够: - **最大化计算效率**:Agent Substrate引入了一个新的控制平面,设计用于处理数亿注册的Agent。与Agent Executor一起,Agent Substrate可以为当今最大的Agent部署提供基础。 - **保持在Kubernetes生态系统内**:Agent Substrate构建在Kubernetes之上,允许通过声明式配置进行调度和水平扩展计算。 在下面的演示中,我们展示了如何使用Agent Executor与Agent Substrate一起运行一个示例工作负载。 https://storage.googleapis.com/gweb-cloudblog-publish/images/maxresdefault_00CLfta.max-1300x1300.jpg ### 立即开始 模型、Agent、工具链以及围绕它们的基础设施都在以比以往更快的速度发展。我们正在开放构建Agent Executor,以便在真实开发者手中验证设计,并根据你的反馈进行改进。 Agent Executor现已提供预览版。我们邀请你探索代码,用你自己的工作负载进行测试,并帮助塑造Agent运行时的未来。立即前往我们的GitHub仓库(https://github.com/google/ax)开始吧。 发布于: - AI与机器学习 (https://cloud.google.com/blog/products/ai-machine-learning) - 应用开发 (https://cloud.google.com/blog/products/application-development)

相似文章

推出 Amazon Bedrock 代理的有状态运行时环境

OpenAI Blog

OpenAI 与亚马逊合作,为 Amazon Bedrock 中的代理推出了有状态运行时环境,支持生产级的多步代理工作流,具备内置状态管理、可靠性和治理能力。该运行时原生运行于 AWS 环境,简化了企业用例(如客户支持、销售运营和财务流程)中复杂的代理编排。