@sydneyrunkle: here's a quick overview of a) what is deepagents b) what makes deepagents good at complex tasks c) how to easily take o…
摘要
DeepAgents是一个可定制的AI代理框架,专为复杂现实任务设计,具备执行环境、上下文管理、委派和人在回路能力,并提供了托管版实现生产级部署。
查看缓存全文
缓存时间: 2026/06/02 05:45
here’s a quick overview of
a) what is deepagents b) what makes deepagents good at complex tasks c) how to easily take one to production!
https://t.co/AO4wrjCdD0 https://t.co/kJYMUcBECn
TL;DR: DeepAgents 是一个可定制的代理框架,专为复杂现实任务设计,核心能力包括执行环境、上下文管理、委派和导向;托管版在此基础上提供生产级运行时、上下文集成和沙箱,大幅降低部署复杂度。
代理、框架与 DeepAgents
什么是代理?
代理是一个简单的模型 + 工具调用循环:模型在一个循环中调用工具,直到完成任务并返回最终结果。
什么是框架?
框架是连接模型与现实世界的一切,包括技能、记忆、基础系统提示、工具、子代理以及任何额外上下文。框架的核心职责是:为给定任务,在正确的时间,为模型提供正确的上下文。模型的能力取决于它所获得的上下文,框架正是为了弥合这一差距而存在。
为什么需要框架?
代理需要:
- 在一个可以采取行动的环境中工作(自主性)。
- 连接到用户数据,使行动与用例相关。
- 管理长时间运行中不断增长的上下文,避免上下文溢出。
- 并行化任务以高效完成复杂工作。
- 与人类交互(人在回路)以处理敏感工作流程。
- 随时间改进以保持相关性和有用性。
什么是 DeepAgents?
DeepAgents 是一个可定制的代理框架,专为复杂的现实世界任务而构建。它包含四项主要能力,下面逐一深入。
DeepAgents 框架的四个核心能力
1. 执行环境
执行环境是 DeepAgents 的支柱,一切都始于文件系统。代理使用文件系统来:
- 读写临时文件
- 加载和存储持久记忆
- 在相关时调用特定任务的技能
代理非常擅长使用文件系统(它们在被训练时大量接触代码)。通过提供沙箱或更轻量的代码解释器,代理获得一个安全的环境来编写和运行代码,从而实现更具创造性的问题解决和动态运行时行为。
2. 上下文管理
DeepAgents 内置多种机制处理上下文溢出:
- 摘要与上下文卸载:定期将大型消息(人类消息、工具结果、工具调用)驱逐到文件系统中,避免快速积累;当历史接近上下文限制时触发摘要。
- 记忆支持:记忆是最重要的上下文类型之一,它在每次运行之间变化,允许代理随时间改进。
- 与提供商无关的提示缓存:对长时间、高上下文的代理至关重要,可降低成本。
- 技能支持:通过“渐进式披露”系统——代理在系统提示中仅加载最少技能信息,然后在相关任务时动态拉取完整技能资源并调用对应脚本。
所有这些机制共同实现框架的核心目标:在正确的时间,为给定任务,向模型提供正确的上下文。
3. 委派
DeepAgents 配备规划工具,允许模型为复杂任务组织工作,并且开箱即用地支持子代理。
子代理可以是通用或专门的。例如,构建编码代理时,可附加架构设计、代码审查、测试编写等专门子代理。
子代理的重要性:
- 以隔离的上下文运行:主代理调用子代理时,子代理以全新上下文启动(仅与其任务相关),之后将精简结果返回主代理,不污染主上下文窗口。
- 支持并行化:通过并行化提高端到端任务效率。
- 可使用任何模型和任何提供商:将模型能力与任务复杂性匹配,例如主代理用 GPT-4,子代理用更便宜的模型。
4. 导向(人在回路)
DeepAgents 通过一流的人回路原语支持四种常见决策模式:
- 审批流程:例如发送邮件前批准。
- 编辑:例如发布推文前编辑内容。
- 拒绝决定:例如拒绝提议的财务交易。
- 响应模式:代理中断执行并向用户提问以解除阻塞。
人在回路对以下两点至关重要:
- 对敏感操作或工具调用获取实时用户反馈。
- 在需要用户输入以解除模型阻塞时获取反馈。
为什么选择 DeepAgents?
与提供商无关
DeepAgents 支持所有主要提供商和模型:Anthropic、OpenAI、Google,Ollama 的本地模型,以及 Fireworks、Nvidia、Open Router、Base Ten 等的开源模型。主代理和子代理可以使用不同模型,随时更换或混搭。
高度可定制
核心代理循环周围提供系统中间件(钩子),可实现:
- 定制业务逻辑
- 任意点的确定性代码
- 策略执行(如 PII 脱敏)
- 动态代理控制(如根据任务在运行时更改可用的模型和工具)
托管式 DeepAgents:生产级部署
即使框架强大,将代理投入生产仍很困难:需要长时间运行、从意外故障恢复、处理人在回路和不可预测行为、支持突发流量、保持安全态势、跟上互操作性标准。托管式 DeepAgents(私有测试版)旨在让这一切变得简单,包含四个核心支柱。
支柱一:框架
Sydney 已详细介绍的 DeepAgents 框架本身。
支柱二:运行时
托管式 DeepAgents 构建在 LangSmith 部署之上,提供:
- 端点:在任何需要的地方创建、更新、调用代理。
- 专用任务队列与水平扩展:处理高峰请求负载(如客服代理在系统宕机时突然涌入大量请求)。
- SDK:与 Copilot Kit、Assistant UI 等集成。
持久执行
基于 LangGraph 运行时,每一步都检查点持久化存储。代理可在任何检查点恢复和重新启动(例如第 49 步失败,从第 49 步继续重试)。支持从任何时间点重放和分叉代理状态,实现人工审批等高级用例。
安全与认证
- 入站认证:验证用户身份与权限。
- 出站认证:代理内部到外部服务的身份验证(如 MCP 工具)。
- 管理认证:RBAC/ABAC 控制创建、更新、管理代理的权限。
代理互操作性
- 远程图谱:通过一行代码,在自定义 LangGraph 应用中调用托管 DeepAgents 代理。
- A 到 A 协议:开箱即用支持代理间通信。
- 带到工作的地方:在深度代理代码、Cloud Desktop 等环境中使用代理。
托管运行时还处理双文本处理、中途取消等繁琐工程,让用户无需自己构建这些基础设施。
支柱三:上下文集成(上下文中心)
上下文中心对代理操作和运行中的每一个文件进行版本管理和保存,包括:
agent.md文件和技能- 代理记录的关于用户的信息
团队可控制不同提升级别(预发布、生产),在不同代理之间民主地共享技能。
上下文中心与 LangSmith Engine 集成:引擎可获取 DeepAgents 的生产使用数据,进行质量改进,修改提示、系统提示或技能,从而持续改善代理行为。
支柱四:沙箱(LangSmith 沙箱)
越来越多的代理成为编码代理(或研究代理在报告中快速处理统计)。沙箱让代理在生产环境中安全地编写和运行代码,获得更具创造性的结果。
沙箱核心功能:
- 出站代理:运行时安全注入凭证,不将环境变量暴露给代理或沙箱。
- 快照与恢复:确保代理始终拥有正确的执行环境。
(更多细节将在明天的会议中由 Mikhail 深入介绍。)
相似文章
@ba_niu80557: https://x.com/ba_niu80557/status/2062103965517721821
文章拆解了2026年Agent框架的六条设计路线(LangGraph、OpenAI Agents SDK、CrewAI、Dify、厂商原生SDK、Pi),并提供了基于状态管理、流程复杂度、人机交互、模型灵活性等维度的选型建议,适合需要在生产环境中选择Agent框架的团队参考。
@aiDotEngineer:真正能投入生产的多智能体架构 https://youtube.com/watch?v=ow1we5PzK-o… 实际可用的多智能体编……
本文深入解析了FactoryAI的Missions多智能体架构,通过角色分工、验证合约与结构化交接机制,实现了可在生产环境中连续稳定运行数十天的自动化编码系统。该设计将软件工程瓶颈从人工执行转向人类注意力管理,为开发者提供了可落地的长期多智能体协作方案。
本文系统梳理了AI Agent架构与工程实践,涵盖控制流、上下文工程、工具设计、记忆、多Agent组织、评测、追踪和安全,基于OpenClaw实现展开,强调Harness(测试验证基础设施)对系统稳定性的关键作用。
本文系统梳理了AI Agent架构与工程实践,涵盖控制流、上下文工程、工具设计、记忆、多Agent组织、评测、追踪和安全,基于OpenClaw实现展开,强调Harness(测试验证基础设施)对系统稳定性的关键作用。
@sydneyrunkle: https://x.com/sydneyrunkle/status/2056419909941522687
Deep Agents v0.6 引入了代码解释器、用于按模型调优的测试配置文件、流式支持、用于检查点存储的 DeltaChannel 以及用于版本化代理记忆的 ContextHubBackend,实现了模型无关的编程式工具调用和递归工作流。
@GitHub_Daily: 用 AI 智能体生产级事情,写代码、跑流程、调接口,一开始还行,但规模一大就容易失控,权限太宽、上下文丢失、调试无从下手。 于是找到了 agents-best-practices 这套完整的智能体运行框架设计指南,不限于编码场景,运营、销…
介绍了 agents-best-practices 仓库,这是一份生产级 AI 智能体运行框架设计指南,涵盖工具权限分级、上下文压缩等,支持 Codex 和 Claude Code 安装。