Agents SDK 的下一步演进

OpenAI Blog 工具

摘要

OpenAI 宣布更新其 Agents SDK,引入了模型原生工作台和原生沙箱执行,以帮助开发者构建生产级 AI 代理,并改进文件处理和安全控制。

OpenAI 更新 Agents SDK,新增原生沙箱执行和模型原生工作台,帮助开发者跨文件和工具构建安全、长期运行的代理。
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/05/08 09:48

# Agents SDK 的下一次进化 来源:https://openai.com/index/the-next-evolution-of-the-agents-sdk/ 我们正在为 Agents SDK 引入新功能,为开发者提供标准化基础设施,这些基础设施易于上手,且为 OpenAI 模型正确构建:一个模型原生框架,让代理能在计算机上跨文件和工具工作,加上原生沙盒执行,确保安全工作安全运行。 例如,开发者可以为代理提供一个受控的工作区、明确的指令以及检查证据所需的工具: 开发者构建有用的代理不仅需要最好的模型,还需要支持代理检查文件、运行命令、编写代码并在多个步骤中持续工作的系统。 如今存在的系统在团队从原型转向生产时存在权衡。模型无关的框架灵活但无法充分利用前沿模型的能力;模型提供商的 SDK 更贴近模型,但往往对框架缺乏足够的可见性;托管代理 API 可以简化部署,但会限制代理的运行位置和敏感数据的访问方式。 以下是一些与我们测试新 SDK 的客户反馈: > “更新后的 Agents SDK 使我们能够自动化一个关键的临床记录工作流程,而此前的方法无法足够可靠地处理。对我们来说,区别不仅在于提取正确的元数据,还在于正确理解长而复杂记录中每次就诊的边界。因此,我们可以更快地了解每位患者在特定就诊中的情况,帮助会员满足他们的护理需求,并改善他们与我们的体验。” —— Rachael Burns,Oscar Health 高级工程师兼 AI 技术负责人 ## 更强大的代理循环框架 随着今天的发布,Agents SDK 框架变得更强大,适用于处理文档、文件和系统的代理。它现在具有可配置内存、沙盒感知编排、类似 Codex 的文件系统工具,以及与前沿代理系统中常见原语的标准化集成。 该框架还通过使执行与模型最佳工作方式对齐,帮助开发者释放更多前沿模型的能力。这使代理更贴近模型的自然操作模式,提高复杂任务的可靠性和性能——特别是当工作长时间运行或需要在多种工具和系统之间协调时。 此外,我们意识到每个产品都是独特的,很难完全符合一个模板。我们设计 Agents SDK 就是为了支持这种多样性。开发者获得一个即用又灵活的框架,易于适应自己的技术栈——包括工具使用、内存和沙盒环境。 ## 原生沙盒执行 更新后的 Agents SDK 原生支持沙盒执行,因此代理可以在受控的计算机环境中运行,拥有任务所需的文件、工具和依赖项。 许多有用的代理需要一个工作区,以便安全地读写文件、安装依赖项、运行代码和使用工具。原生沙盒支持为开发者提供了即开即用的执行层,无需他们自行拼凑。 开发者可以自带沙盒,或使用对 Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop 和 Vercel 的内置支持。 为了跨提供商使这些环境可移植,SDK 还引入了 Manifest 抽象来描述代理的工作区。开发者可以挂载本地文件、定义输出目录,并从 AWS S3、Google Cloud Storage、Azure Blob Storage 和 Cloudflare R2 等存储提供商引入数据。 这为开发者提供了一种一致的方式,从本地原型到生产部署塑造代理环境。它还为模型提供了一个可预测的工作区:在哪里找到输入,在哪里写入输出,以及如何在长时间运行的任务中保持工作有序。 ## 分离框架与计算,实现安全性、持久性和可扩展性 代理系统应设计为假设存在提示注入和数据泄露尝试。分离框架和计算有助于将凭据保留在模型生成代码执行的环境之外。 它还能实现持久执行。当代理的状态被外部化时,丢失沙盒容器并不意味着丢失运行。借助内置的快照和恢复功能,如果原始环境失败或过期,Agents SDK 可以在新容器中恢复代理的状态,并从最后一个检查点继续执行。 最后,它使代理更具可扩展性。代理运行可以使用一个或多个沙盒,仅在需要时调用沙盒,将子代理路由到隔离的环境,并跨容器并行化工作以加快执行速度。 ## 定价和可用性 这些新的 Agents SDK 功能已通过 API 对所有客户普遍可用,并使用标准的 API 定价,基于令牌和工具使用。 ## 下一步计划 随着我们继续开发 Agents SDK,我们将不断扩展开发者可以使用它构建的内容,使更强大的代理更容易投入生产,而无需自定义基础设施,同时保留开发者将代理融入自己环境所需的灵活性和控制力。 新的框架和沙盒功能将首先在 Python 中推出,TypeScript 支持计划在未来的版本中提供。我们还在努力为 Python 和 TypeScript 带来额外的代理功能,包括代码模式和子代理。 此外,我们希望随着时间的推移帮助更广泛的代理生态系统整合,支持更多沙盒提供商、更多集成,以及更多方式让开发者将 SDK 插入他们已经使用的工具和系统。

相似文章

构建智能体的新工具

OpenAI Blog

OpenAI 推出了一系列用于构建智能体的新工具,包括 Responses API、内置工具(网络搜索、文件搜索、计算机使用)、Agents SDK 和可观测性功能,旨在简化智能体应用程序开发。

openai/openai-agents-python

GitHub Trending (daily)

OpenAI 发布 openai-agents-python,这是一个轻量级框架,用于构建多智能体工作流,支持 OpenAI API 和 100+ 其他大语言模型。该 SDK 包含沙箱智能体、工具、护栏、人工介入循环、追踪和实时语音智能体等功能。

推出 AgentKit、新的 Evals 和用于代理的 RFT

OpenAI Blog

OpenAI 推出了 AgentKit,这是一套用于构建、部署和优化代理的综合工具套件,包括可视化 Agent Builder、用于企业数据管理的 Connector Registry,以及扩展的评估功能,包括新数据集和自动提示优化功能。

OpenAI:面向企业的 Workspace Agents

Hacker News Top

OpenAI 为 ChatGPT Business 与 Enterprise 方案推出 workspace agents,让团队可构建并共享能自主处理工作流、集成各类工具,并在管理员权限与审计日志管控下运行的 AI 代理。