@sydneyrunkle: here's a quick overview of a) what is deepagents b) what makes deepagents good at complex tasks c) how to easily take o…

X AI KOLs Following 2026/06/01 12:25 工具

摘要

DeepAgents是一个可定制的AI代理框架，专为复杂现实任务设计，具备执行环境、上下文管理、委派和人在回路能力，并提供了托管版实现生产级部署。

here's a quick overview of a) what is deepagents b) what makes deepagents good at complex tasks c) how to easily take one to production! https://t.co/AO4wrjCdD0 https://t.co/kJYMUcBECn

查看原文

查看缓存全文

缓存时间: 2026/06/02 05:45

here’s a quick overview of

a) what is deepagents b) what makes deepagents good at complex tasks c) how to easily take one to production!

https://t.co/AO4wrjCdD0 https://t.co/kJYMUcBECn

TL;DR: DeepAgents 是一个可定制的代理框架，专为复杂现实任务设计，核心能力包括执行环境、上下文管理、委派和导向；托管版在此基础上提供生产级运行时、上下文集成和沙箱，大幅降低部署复杂度。

代理、框架与 DeepAgents

什么是代理？

代理是一个简单的模型 + 工具调用循环：模型在一个循环中调用工具，直到完成任务并返回最终结果。

什么是框架？

框架是连接模型与现实世界的一切，包括技能、记忆、基础系统提示、工具、子代理以及任何额外上下文。框架的核心职责是：为给定任务，在正确的时间，为模型提供正确的上下文。模型的能力取决于它所获得的上下文，框架正是为了弥合这一差距而存在。

为什么需要框架？

代理需要：

在一个可以采取行动的环境中工作（自主性）。
连接到用户数据，使行动与用例相关。
管理长时间运行中不断增长的上下文，避免上下文溢出。
并行化任务以高效完成复杂工作。
与人类交互（人在回路）以处理敏感工作流程。
随时间改进以保持相关性和有用性。

什么是 DeepAgents？

DeepAgents 是一个可定制的代理框架，专为复杂的现实世界任务而构建。它包含四项主要能力，下面逐一深入。

DeepAgents 框架的四个核心能力

1. 执行环境

执行环境是 DeepAgents 的支柱，一切都始于文件系统。代理使用文件系统来：

读写临时文件
加载和存储持久记忆
在相关时调用特定任务的技能

代理非常擅长使用文件系统（它们在被训练时大量接触代码）。通过提供沙箱或更轻量的代码解释器，代理获得一个安全的环境来编写和运行代码，从而实现更具创造性的问题解决和动态运行时行为。

2. 上下文管理

DeepAgents 内置多种机制处理上下文溢出：

摘要与上下文卸载：定期将大型消息（人类消息、工具结果、工具调用）驱逐到文件系统中，避免快速积累；当历史接近上下文限制时触发摘要。
记忆支持：记忆是最重要的上下文类型之一，它在每次运行之间变化，允许代理随时间改进。
与提供商无关的提示缓存：对长时间、高上下文的代理至关重要，可降低成本。
技能支持：通过“渐进式披露”系统——代理在系统提示中仅加载最少技能信息，然后在相关任务时动态拉取完整技能资源并调用对应脚本。

所有这些机制共同实现框架的核心目标：在正确的时间，为给定任务，向模型提供正确的上下文。

3. 委派

DeepAgents 配备规划工具，允许模型为复杂任务组织工作，并且开箱即用地支持子代理。

子代理可以是通用或专门的。例如，构建编码代理时，可附加架构设计、代码审查、测试编写等专门子代理。

子代理的重要性：

以隔离的上下文运行：主代理调用子代理时，子代理以全新上下文启动（仅与其任务相关），之后将精简结果返回主代理，不污染主上下文窗口。
支持并行化：通过并行化提高端到端任务效率。
可使用任何模型和任何提供商：将模型能力与任务复杂性匹配，例如主代理用 GPT-4，子代理用更便宜的模型。

4. 导向（人在回路）

DeepAgents 通过一流的人回路原语支持四种常见决策模式：

审批流程：例如发送邮件前批准。
编辑：例如发布推文前编辑内容。
拒绝决定：例如拒绝提议的财务交易。
响应模式：代理中断执行并向用户提问以解除阻塞。

人在回路对以下两点至关重要：

对敏感操作或工具调用获取实时用户反馈。
在需要用户输入以解除模型阻塞时获取反馈。

为什么选择 DeepAgents？

与提供商无关

DeepAgents 支持所有主要提供商和模型：Anthropic、OpenAI、Google，Ollama 的本地模型，以及 Fireworks、Nvidia、Open Router、Base Ten 等的开源模型。主代理和子代理可以使用不同模型，随时更换或混搭。

高度可定制

核心代理循环周围提供系统中间件（钩子），可实现：

定制业务逻辑
任意点的确定性代码
策略执行（如 PII 脱敏）
动态代理控制（如根据任务在运行时更改可用的模型和工具）

托管式 DeepAgents：生产级部署

即使框架强大，将代理投入生产仍很困难：需要长时间运行、从意外故障恢复、处理人在回路和不可预测行为、支持突发流量、保持安全态势、跟上互操作性标准。托管式 DeepAgents（私有测试版）旨在让这一切变得简单，包含四个核心支柱。

支柱一：框架

Sydney 已详细介绍的 DeepAgents 框架本身。

支柱二：运行时

托管式 DeepAgents 构建在 LangSmith 部署之上，提供：

端点：在任何需要的地方创建、更新、调用代理。
专用任务队列与水平扩展：处理高峰请求负载（如客服代理在系统宕机时突然涌入大量请求）。
SDK：与 Copilot Kit、Assistant UI 等集成。

持久执行

基于 LangGraph 运行时，每一步都检查点持久化存储。代理可在任何检查点恢复和重新启动（例如第 49 步失败，从第 49 步继续重试）。支持从任何时间点重放和分叉代理状态，实现人工审批等高级用例。

安全与认证

入站认证：验证用户身份与权限。
出站认证：代理内部到外部服务的身份验证（如 MCP 工具）。
管理认证：RBAC/ABAC 控制创建、更新、管理代理的权限。

代理互操作性

远程图谱：通过一行代码，在自定义 LangGraph 应用中调用托管 DeepAgents 代理。
A 到 A 协议：开箱即用支持代理间通信。
带到工作的地方：在深度代理代码、Cloud Desktop 等环境中使用代理。

托管运行时还处理双文本处理、中途取消等繁琐工程，让用户无需自己构建这些基础设施。

支柱三：上下文集成（上下文中心）

上下文中心对代理操作和运行中的每一个文件进行版本管理和保存，包括：

agent.md 文件和技能
代理记录的关于用户的信息

团队可控制不同提升级别（预发布、生产），在不同代理之间民主地共享技能。

上下文中心与 LangSmith Engine 集成：引擎可获取 DeepAgents 的生产使用数据，进行质量改进，修改提示、系统提示或技能，从而持续改善代理行为。

支柱四：沙箱（LangSmith 沙箱）

越来越多的代理成为编码代理（或研究代理在报告中快速处理统计）。沙箱让代理在生产环境中安全地编写和运行代码，获得更具创造性的结果。

沙箱核心功能：

出站代理：运行时安全注入凭证，不将环境变量暴露给代理或沙箱。
快照与恢复：确保代理始终拥有正确的执行环境。

（更多细节将在明天的会议中由 Mikhail 深入介绍。）

Source: @sydneyrunkle: here’s a quick overview of a) what is deepagents b) what makes deepagents good at complex tasks c) how to easily take o…

相似文章

@sydneyrunkle: https://x.com/sydneyrunkle/status/2071629451712983319

X AI KOLs Timeline

Deep Agents 引入了动态子代理，它们通过代码脚本进行程序化编排，而不是使用工具调用，从而实现了可靠的扩展和复杂的工作流程。该功能集成了 QuickJS 代码解释器以实现轻量级执行。

@ba_niu80557: https://x.com/ba_niu80557/status/2062103965517721821

X AI KOLs Timeline

文章拆解了2026年Agent框架的六条设计路线（LangGraph、OpenAI Agents SDK、CrewAI、Dify、厂商原生SDK、Pi），并提供了基于状态管理、流程复杂度、人机交互、模型灵活性等维度的选型建议，适合需要在生产环境中选择Agent框架的团队参考。

@DanKornas：复杂的研究型智能代理会很快变得杂乱：计划、搜索、RAG、代码执行、反馈和最终报告都需要整合在一起……

X AI KOLs Timeline

DeepResearch 是一个基于 Spring AI Alibaba 构建的开源多智能体研究工具，能够将查询转化为结构化报告，它采用动态规划、多智能体角色、混合 RAG 和基于 Docker 的执行方式。

@Xudong07452910: 开源框架推荐：《Agency Agents》—— 232 位专业 AI 智能体，按职能分工，覆盖 16 个业务部门如果你用过 Claude Code 或 Codex，可能遇到过这个问题：AI 在代码任务上很能干，但让它做前端设计、写营销…

X AI KOLs Timeline

Agency Agents 是一个开源框架，提供232个专业AI智能体覆盖16个业务部门，每个智能体具有独特个性、沟通风格和交付标准，支持Claude Code、GitHub Copilot等多种开发工具，并有社区翻译版本。

@aiDotEngineer：真正能投入生产的多智能体架构 https://youtube.com/watch?v=ow1we5PzK-o… 实际可用的多智能体编……

X AI KOLs Timeline

本文深入解析了FactoryAI的Missions多智能体架构，通过角色分工、验证合约与结构化交接机制，实现了可在生产环境中连续稳定运行数十天的自动化编码系统。该设计将软件工程瓶颈从人工执行转向人类注意力管理，为开发者提供了可落地的长期多智能体协作方案。

代理、框架与 DeepAgents

什么是代理？

什么是框架？

为什么需要框架？

什么是 DeepAgents？

DeepAgents 框架的四个核心能力

1. 执行环境

2. 上下文管理

3. 委派

4. 导向（人在回路）

为什么选择 DeepAgents？

与提供商无关

高度可定制

托管式 DeepAgents：生产级部署

支柱一：框架

支柱二：运行时

持久执行

安全与认证

代理互操作性

支柱三：上下文集成（上下文中心）

支柱四：沙箱（LangSmith 沙箱）

相似文章

@sydneyrunkle: https://x.com/sydneyrunkle/status/2071629451712983319

@ba_niu80557: https://x.com/ba_niu80557/status/2062103965517721821

@DanKornas：复杂的研究型智能代理会很快变得杂乱：计划、搜索、RAG、代码执行、反馈和最终报告都需要整合在一起……

@Xudong07452910: 开源框架推荐：《Agency Agents》—— 232 位专业 AI 智能体，按职能分工，覆盖 16 个业务部门 如果你用过 Claude Code 或 Codex，可能遇到过这个问题：AI 在代码任务上很能干，但让它做前端设计、写营销…

@aiDotEngineer：真正能投入生产的多智能体架构 https://youtube.com/watch?v=ow1we5PzK-o… 实际可用的多智能体编……

提交意见反馈

@Xudong07452910: 开源框架推荐：《Agency Agents》—— 232 位专业 AI 智能体，按职能分工，覆盖 16 个业务部门如果你用过 Claude Code 或 Codex，可能遇到过这个问题：AI 在代码任务上很能干，但让它做前端设计、写营销…