智能代理界面的演变:使用Claude Managed Agents进行构建(13分钟阅读)
摘要
Anthropic推出了Claude Managed Agents,这是一组可组合的API,用于构建和部署生产级代理,解决了将原型与生产分离的基础设施挑战。
Claude Managed Agents通过提供带有集成基础设施的可组合API,简化了生产级代理的构建过程。
查看缓存全文
缓存时间: 2026/06/11 13:45
# 智能体表面的演进:使用 Claude Managed Agents 进行构建
来源:https://claude.com/blog/building-with-claude-managed-agents
让一个智能体投入生产,仅仅依靠一个好的提示词是不够的。智能体需要运行其所编写代码的场所、访问数据的凭证、可观察的会话,以及能够随使用量扩展的基础设施。在应用 AI 团队,我们工作在产品、研究以及基于 Claude 构建的客户之间的交汇点上——并且我们反复看到同一个模式:基础设施就是区分原型与生产级智能体的关键。团队常常将开发周期耗费在安全、状态管理、权限和工具链调优上。
Claude Managed Agents (https://platform.claude.com/docs/en/managed-agents/overview) 是我们用于构建和部署生产级智能体的一套可组合 API,它将经过性能调优的智能体框架与生产基础设施配对,使团队能够在数天内(而非数月内)从原型走到上线。在这篇文章中,我们将介绍 Anthropic 智能体构建模块的演进、我们为什么构建了 Claude Managed Agents,以及团队如今在生产中如何使用它。
## **智能体架构的演进**
当我们在 2023 年向开发者开放 Claude 时,API 刻意保持简单:输入 token,输出 token。你发送一个提示词,Claude 返回一个补全结果,然后你自行构建框架和底层基础设施。
几年来,API 逐渐变得丰富,但底层的契约从未改变:一个请求,一次模型调用,由你的应用程序决定接下来做什么。很长一段时间内,这已经足够了。总结文档、分类支持工单、重写文本块——这些工作单次调用就能轻松搞定。
然而,随着时间推移,人们想交给 Claude 的任务不再局限于单次调用。他们希望 Claude 能把任务执行到底,查找信息、采取行动、观察变化、再决定下一步。他们还希望 Claude 能够*在*他们已有的工作系统(如代码库、内部 Wiki 或工单系统)中运作。
通过 API,把 Claude 变成一个智能体意味着要自己构建循环:询问模型该做什么,运行工具,把结果反馈回去,然后重复。你需要负责构建和部署智能体的脚手架,而随着模型的演进,这些脚手架可能还需要调优。对于需要完全自定义的智能体,这种方法是有道理的。但对于那些更具可预测性且复杂度较低的智能体工作负载,随着模型和产品的演进,优化框架变得繁琐。
Claude Code (https://code.claude.com/docs/en/overview) 是我们于 2025 年推出的智能体编码工具,它让 Claude 能够直接与代码库交互,其中包含了我们自己的框架版本:循环、工具执行、子智能体、上下文管理,以及使其成为高效智能体的丰富能力。开发者自然希望在自己的跨领域智能体中也拥有类似的框架机制。
为了让团队能够在 Claude Code 框架之上构建智能体,我们发布了 Claude Agent SDK (https://code.claude.com/docs/en/agent-sdk/overview)。Claude Agent SDK 为开发者提供了工具,使他们能够基于运行 Claude Code 的同一机制构建自己的智能体,而无需维护自研的循环。对于许多团队来说,这时智能体才变得实用:框架已经针对 Claude 进行了调优,并且随着 Claude Code 的改进而不断优化。
然而,即使有了框架,在生产环境中部署智能体仍然可能面临以下挑战:
- **托管与扩展。** 智能体在哪里运行?对于耗时数小时的任务,进程能存活多久?当使用量增长时,由什么来扩展它?
- **会话管理。** 智能体的历史记录和进展保存在哪里?一次运行能否在中断后无碍地恢复?你能回溯并检查之前会话中发生了什么吗?
- **文件系统管理。** 完成实际工作意味着产生工件:编辑代码、写入文件、构建输出。智能体从哪里获得一个工作空间来操作?不同运行之间,这个工作空间如何处理?
- **执行隔离。** Claude 编写的代码必须在某个地方执行。如果代码出错,其影响范围有多大?你真正愿意在生产中信任的边界是什么?
- **凭证。** 智能体需要访问你的系统。它如何在不向所生成的代码暴露专有信息的情况下获得这种访问权限?
- **可观测性。** 当一个智能体自主工作一小时后做出了意料之外的事情,你能重建它采取的每一步吗?
使用 Agent SDK,上述生产基础设施的许多元素都通过 Claude Code 的机制提供。智能体获得一个真正的文件系统来工作,会话状态持久化在本地或外部存储中,可观测性通过 OpenTelemetry 导出到你正在运行的任何监控栈中。
然而,随着团队越来越多地将智能体从本地开发迁移到生产环境,他们需要一种方法来大规模部署,并拥有托管基础设施。随着模型及其周围的框架变得越来越先进——运行时间更长、执行更多代码、接触更多系统、采取更多操作——扩展、安全和沙箱化变得更具挑战性。
其中几个障碍源于一个常见的架构选择:智能体框架通常*与它所操作的文件系统运行在同一个容器中*。在 Claude 开始思考之前,容器必须启动(付出启动代价),智能体与代码执行紧邻你的凭证,当容器死亡时,运行也随之终止。
Managed Agents 通过**将大脑与手分离** (https://www.anthropic.com/engineering/managed-agents) 解决了这些问题。调用 Claude 的框架与代码执行的沙箱分开运行,而会话——一个只追加的、包含每次模型调用、工具调用和结果的日志——将两者连接起来。Claude 可以在任何容器存在之前就开始推理,沙箱远离你的凭证,并且整个过程随时可以从其会话中重建。
## **何时以及为何使用 Claude Managed Agents**
使用 Managed Agents 构建时,用户定义任务、工具和护栏,而 Anthropic 在我们的基础设施上运行智能体,并处理底层的智能体循环:如何为智能体提供执行环境来调用工具,如何在失败时恢复,多智能体编排等等。
当框架不与模型智能同步演进时,**智能体就会崩溃** (https://www.anthropic.com/engineering/harness-design-long-running-apps)。在 Claude Sonnet 4.5 上,当智能体接近其上下文末尾时,它会急于完成任务,而不是利用剩余空间,这被称为“上下文焦虑”模式。我们的解决方案是在框架中添加上下文重置,假定 Claude 在接近极限时需要帮助才能保持连贯。但这个假定在下一版模型中不再成立。在 Claude Opus 4.5 上,该行为消失了,我们添加的重置变成了纯粹的负担。
对于大多数组织来说,维护框架是并不使产品差异化的开销。框架必须针对特定模型行为进行调优;像压缩、工具执行和缓存这样的原语在 Claude 上与其他模型上的工作方式不同。使用 Claude Managed Agents,框架与模型同步演进,使团队能够专注于使他们的智能体差异化的关键:**上下文管理和领域专业知识**。
为了让开发者能够配置必要的上下文和工具来构建高效的智能体,Managed Agents 围绕三个主要资源构建:智能体、环境和会话。*智能体*是一个配置:模型、提示词、一组工具以及相应的护栏。*环境*是智能体运行的执行上下文:沙箱容器、其网络规则及其中预装的包,可以托管在我们的云上或你自己控制的基础设施上。每次运行是一个*会话*,它将一个智能体与环境配对,并获得自己独立的沙箱实例。会话在服务端持久化其完整的事件历史、沙箱状态和输出,因此长时间运行的工作可以暂停、干净地恢复,并且在事后可以逐步追溯。使用 Managed Agents,你可以定义一次智能体和环境,然后随着工作负载的增长对同一配置运行多个会话。
.png)
## **在 Managed Agents 上构建生产级和可扩展的应用**
在应用 AI 团队内部,我们看到智能体从原型走向生产,无论是在 Anthropic 内部还是在我们客户的系统中,跨越编码、金融、支持、法律等十几个领域。这让我们清晰地看到 demo 与生产就绪智能体的区别,以及团队经常卡住的环节。
下面,我们分享最常见的理由,来说明为何在像 Claude Managed Agents 这样的托管服务上进行构建:
**1. 凭证被保留在沙箱之外。** 当所有内容都在一个容器中运行时,Claude 生成的代码就紧挨着你的凭证,因此提示注入可能通过诱使模型读取自身环境而导致令牌泄露。我们可以通过在同一个容器中设置强大的护栏来防范这一点,但将架构解耦能够实现更安全的方法,即完全将凭证留在沙箱之外。用于 MCP、CLI 和 GitHub 仓库等工具的令牌存储在一个单独的保险库中,代理仅在需要时按需获取并解密。Managed Agents 提供了 Vaults (https://platform.claude.com/docs/en/managed-agents/vaults),开箱即用地处理凭证,这样你无需运行自己的秘密存储,无需在每次调用时传输令牌,也不会丢失对智能体代表哪个最终用户采取行动的追踪。保险库凭证在存储前使用信封加密进行保护,检索时需要签名请求令牌进行验证。
.png)
**2. 通过消除沙箱开销降低延迟。** 延迟是许多企业团队高度关注的指标,因为用户能敏锐地感受到等待 Claude 响应的时刻。没有 Managed Agents 架构,每次会话都必须启动一个容器,即使智能体只需要思考而从不运行工具。这种启动时间被浪费了,用户会感觉到第一个响应之前的延迟。使用 Managed Agents,Claude 立即开始推理,同时环境并行启动,从未运行工具的会话完全跳过容器。这意味着用户在等待容器启动之前就能看到第一个 token,而当智能体需要运行某些操作时环境已经就绪。在我们的测试中,这使第一个 token 的时间在中位数情况下 (p50) 缩短了约 60%,在最慢的情况下 (p95) 缩短了超过 90%。
**3. 可靠、持久的会话,实现会话管理、可观测性和记忆。** Managed Agents 不以请求/响应来思考,而是以*事件*为单位。会话是一个持续的事件流:每次模型调用、工具调用和结果,都被追加到一个位于运行智能体进程之外的日志中。凭借这种架构,当智能体工作时,你可以实时获取事件流的更新,并且可以在无需管理数据库或检查点的情况下稍后恢复任何会话。除非你删除会话,否则历史记录会保留在交互之间;当会话空闲时,其容器会被检查点化,以便你可以从暂停的位置干净地继续。由于整个过程已经是一个事件记录,可观测性和记忆也随之而来:Claude Developer Console 提供了原生可视化时间线视图来展示智能体会话,以及允许你深入检查任何转录本的调试体验。Managed Agents 还提供了诸如记忆和梦境等功能,也利用了这种会话持久性。梦境 (https://platform.claude.com/docs/en/managed-agents/dreams) 是一个定时进程,它会审查你的智能体会话和记忆存储,提取模式,并整理记忆,让你的智能体随时间不断改进。梦境在会话之间优化记忆,通过读取持久化的会话日志,它能从反复出现的错误和用户偏好中学习。
**4. Anthropic 托管或自托管云容器的灵活性。** 默认情况下,使用 Managed Agents,你可以将编排和工具执行都委托给 Anthropic 托管的云容器。这使得托管和扩展变得简单易行,提供了更快的生产路径。由于大脑与手在 Managed Agents 中是分离的,手可以存在于任何地方,包括你的虚拟私有云 (VPC) 内部。因此,我们还提供了自托管沙箱 (https://platform.claude.com/docs/en/managed-agents/self-hosted-sandboxes),供希望控制工具执行的团队使用,这样智能体的代码、文件系统和网络出口永远不会离开他们的环境。我们还提供了 MCP 隧道 (https://platform.claude.com/docs/en/agents-and-tools/mcp-tunnels/overview),让你将 Claude 连接到运行在你私有网络内部的 Model Context Protocol (MCP) 服务器。因此,自托管沙箱控制*智能体的代码在哪里执行*,MCP 隧道控制*Anthropic 如何到达你网络中的 MCP 服务器*,使你能够精确控制哪些内容留在你的边界内。
*Claude Managed Agents 的内置可观测性控制台记录每一个事件,因此你可以浏览时间线,打开任何步骤,并读取其原始负载。*除了这些功能,其他能力还包括:让智能体根据评分基准自我评估工作结果的 outcomes、多智能体编排、权限策略和 webhooks。了解更多,请查阅此处 (https://platform.claude.com/docs/en/managed-agents/overview)。
### **客户如何在今天基于 Managed Agents 进行构建**
跨行业,客户已经使用 Claude Managed Agents 在生产中部署智能体。以下是一些例子:
- Notion (https://claude.com/customers/notion) 基于 Managed Agents 运行其自定义智能体:团队直接从任务面板将工作分配给 Claude,Claude 获取每个任务相关的文档、会议记录和关联数据,然后将完成的代码、演示文稿和站点放回工作区供审查。数十个任务并行运行,他们的团队描述早期原型将大约十二小时的工作转变为二十分钟。
- Rakuten (https://claude.com/customers/rakuten) 使用 Managed Agents 在产品、销售、市场和财务等部门部署了专业化智能体,每个智能体大约在一周内上线。
- Sentry (https://claude.com/customers/sentry) 将其 Seer 调试智能体与一个编写补丁并提交 PR 的 Claude 智能体配对,由一名工程师在数周内(而非数月内)构建完成。
- Asana (https://claude.com/blog/claude-managed-agents) 构建了能够在项目内接手任务的 AI 队友,Atlassian (https://claude.com/blog/claude-managed-agents) 将开发者智能体整合到 Jira 工作流中。
## **开始使用 Claude Managed Agents**
我们构建 Managed Agents 的目的是让通过 Claude Code 和 Claude Developer Console 在 platform.claude.com (http://platform.claude.com/) 上快速启动智能体变得尽可能简单。例如,控制台的快速入门让你可以从一个智能体模板开始,或者用自然语言描述一个智能体,然后将其转变为一个可在几分钟内安全部署的生产就绪智能体。
*platform.claude.com 上的智能体快速入门:从模板开始或描述你想要构建的内容。*
*几步之后:智能体已创建,环境已配置,会话已启动。控制台实时流式传输运行过程。*在 Claude Code 中,/claude-api 技能 (https://platform.claude.com/docs/en/agents-and-tools/agent-skills/claude-api-skill) 是平
相似文章
扩展托管智能体:将大脑与执行层解耦
Anthropic 在 Claude 平台推出托管智能体(Managed Agents),这是一项托管服务,通过将智能体组件解耦,提升长程任务的扩展性与可靠性。
@zodchiii:Anthropic 官方详解如何用 Claude 构建 AI Agent,架构深度超越多数 AI 课程……
Anthropic 联合 AWS 带来现场演示,手把手教你用 Claude 搭建 AI Agent,涵盖架构、工具、记忆、编排与部署全流程。
构建高效的智能体
Anthropic 发布了构建高效 AI 智能体的工程指南,倡导采用简单、可组合的模式以及直接使用 API,而非依赖复杂的框架。文章区分了工作流与自主智能体,并就何时使用每种架构提供了实用建议。
Claude 推出自我改进型智能体(5 分钟阅读)
Anthropic 宣布为 Claude Managed Agents 带来多项新功能,包括用于自我改进记忆的“dreaming(梦境)”功能、基于结果的评估循环,以及多智能体编排能力。
利用 Agent Skills 为智能体装备真实世界能力
Anthropic 推出「Agent Skills」开放标准,通过可组合的指导指令与脚本目录,为 AI 智能体赋予领域专属专业能力。该框架提升了 Claude Code 等智能体的可移植性与专业化程度,且无需进行定制化模型训练。