Codex 正式推出

OpenAI Blog 2025/05/16 08:00 产品

摘要

OpenAI 推出 Codex，一个基于云的 AI 软件工程助手，由 codex-1（优化的 o3）驱动，能够编写功能、修复错误和提出带有并行任务执行的拉取请求。现已面向 ChatGPT Pro、Business、Enterprise 用户提供，Plus 和 Edu 支持即将推出。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/04/20 14:44

# 介绍 Codex 来源：https://openai.com/index/introducing-codex/ 一个基于云的软件工程代理，可以并行处理多项任务，由 codex-1 驱动。现已向 ChatGPT Pro、Business 和 Enterprise 用户开放，Plus 用户即将开放。 ***2025 年 6 月 3 日更新：*** Codex 现已向 ChatGPT Plus 用户开放。我们还允许用户在任务执行期间为 Codex 提供互联网访问。请参阅 **[changelog](https://help.openai.com/en/articles/11428266-codex-changelog)**（在新窗口中打开）和 **[docs](https://platform.openai.com/docs/codex)**（在新窗口中打开）了解更多详情。 --- 今天我们发布了 Codex 的研究预览版：一个基于云的软件工程代理，可以并行处理多项任务。Codex 可以为你执行多项任务，如编写功能、回答关于代码库的问题、修复错误和提议拉取请求供审查；每项任务都在自己的云沙箱环境中运行，环境中预加载了你的仓库。 Codex 由 codex-1 驱动，这是针对软件工程优化的 OpenAI o3 版本。它通过在各种环境中对真实编码任务进行强化学习训练，生成的代码紧密匹配人类风格和拉取请求偏好，精确遵循指令，并能迭代运行测试直到获得通过结果。我们开始向 ChatGPT Pro、Enterprise 和 Business 用户推出 Codex，Plus 和 Edu 用户的支持即将推出。如今你可以通过 ChatGPT 侧边栏访问 Codex，并通过输入提示语并点击 **"Code"** 来分配新的编码任务。如果你想询问 Codex 关于代码库的问题，点击 **"Ask"**。每项任务都在单独的隔离环境中独立处理，环境中预加载了你的代码库。Codex 可以读取和编辑文件，以及运行命令，包括测试框架、linter 和类型检查器。任务完成通常需要 1 到 30 分钟，具体取决于复杂性，你可以实时监控 Codex 的进度。 Codex 完成任务后，会在其环境中提交更改。Codex 通过引用终端日志和测试输出提供其操作的可验证证据，允许你追踪任务完成期间采取的每一步。然后你可以审查结果、请求进一步修订、打开 GitHub 拉取请求，或直接将更改集成到本地环境。在产品中，你可以配置 Codex 环境以尽可能接近你的真实开发环境。 Codex 可以由放置在你仓库中的 AGENTS.md 文件指导。这些是文本文件，类似于 README.md，你可以告诉 Codex 如何浏览代码库、运行哪些命令进行测试，以及如何最好地遵守项目的标准实践。与人类开发者一样，当提供配置好的开发环境、可靠的测试设置和清晰的文档时，Codex 代理表现最佳。在编码评估和内部基准上，即使没有 AGENTS.md 文件或自定义脚手架，codex-1 也显示出强大的性能。 23 个在我们的内部基础设施上不可运行的 SWE-Bench Verified 样本被排除。codex-1 在最大上下文长度 192k token 和中等"推理effort"进行了测试，这是今天在产品中可用的设置。有关 o3 评估的详情，[见此](https://openai.com/index/introducing-o3-and-o4-mini/)。我们的内部 SWE 任务基准是 OpenAI 内部精心策划的真实 SWE 任务集合。我们按照迭代部署策略以研究预览的形式发布 Codex。在设计 Codex 时，我们优先考虑安全性和透明度，以便用户能够验证其输出——这一保障措施随着 AI 模型独立处理更复杂的编码任务和安全考虑的演进而变得越来越重要。用户可以通过引用、终端日志和测试结果来检查 Codex 的工作。当面临不确定或测试失败时，Codex 代理明确传达这些问题，使用户能够做出关于如何继续的明智决定。用户在集成和执行前仍必须手动审查和验证所有代理生成的代码。在蓝色背景上进行代码审查的屏幕截图，带有测试文件叠加层验证引用的文件名、摘要和通过的测试。在蓝色-粉红色背景上显示引用的文件名的一个通过测试的黑色终端叠加层的代码审查屏幕截图；"修复 /diff 特殊字符错误"变更的摘要和差异可见。在训练 codex-1 时的一个主要目标是使输出与人类编码偏好和标准密切一致。与 OpenAI o3 相比，codex-1 持续生成更清晰的补丁，可立即供人类审查和集成到标准工作流中。针对 AI 驱动软件工程的恶意应用（如恶意软件开发）的防护越来越关键。同时，保护措施不应过度妨碍合法和有益的应用，这些应用可能涉及有时也用于恶意软件开发的技术，如低级内核工程。为了平衡安全性和效用，Codex 被训练用于识别并精确拒绝针对恶意软件开发的请求，同时清晰地区分和支持合法任务。我们还增强了政策框架并纳入了严格的安全评估以有效强化这些界限。我们发布了 [o3 系统卡的附录](https://openai.com/index/o3-o4-mini-codex-system-card-addendum/) 以反映这些评估。 Codex 代理完全在云中安全隔离的容器内运行。在任务执行期间，互联网访问被禁用，限制代理仅与通过 GitHub 仓库明确提供的代码和用户通过设置脚本配置的预装依赖进行交互。代理无法访问外部网站、API 或其他服务。 OpenAI 的技术团队已开始使用 Codex 作为其日常工具的一部分。OpenAI 工程师最常使用它来处理重复性、范围明确的任务，如重构、重命名和编写测试，这些任务否则会破坏专注力。它同样适用于脚手架新功能、连接组件、修复错误和草拟文档。团队围绕它形成了新习惯：对值班问题进行分类、在一天开始时规划任务，以及卸载后台工作以继续前进。通过减少上下文切换和浮现被遗忘的待办事项，Codex 帮助工程师更快地发布并专注于最重要的事情。在发布前，我们还与一小群外部测试者合作，以更好地了解 Codex 在不同代码库、开发流程和团队中的表现。 - [Cisco](https://blogs.cisco.com/news/the-future-is-coming-faster-than-you-think)（在新窗口中打开）正在探索 Codex 如何帮助其工程团队更快地实现雄心勃勃的想法。作为早期设计合作伙伴，Cisco 通过评估 Codex 在其产品组合中的真实使用案例并向 OpenAI 团队提供反馈来帮助塑造 Codex 的未来。 - [Temporal](https://temporal.io/)（在新窗口中打开）使用 Codex 加快功能开发、调试问题、编写和执行测试以及重构大型代码库。它还通过在后台运行复杂任务来帮助他们保持专注——让工程师保持流畅状态，同时加快迭代。 - [Superhuman](https://superhuman.com/)（在新窗口中打开）使用 Codex 加快小型但重复的任务，如改进测试覆盖率和修复集成失败。它还通过使产品经理能够贡献轻量级代码更改来帮助他们更快地发布，无需拉入工程师，除了代码审查外。 - [Kodiak](https://kodiak.ai/)（在新窗口中打开）正在使用 Codex 帮助编写调试工具、改进测试覆盖率和重构代码——加快 Kodiak Driver（其自动驾驶技术）的开发。Codex 也已成为一个有价值的参考工具，通过浮现相关上下文和过去的更改来帮助工程师了解堆栈中不熟悉的部分。根据早期测试者的学习，我们建议同时向多个代理分配范围明确的任务，并尝试不同类型的任务和提示以有效探索模型的能力。上个月，我们推出了 Codex CLI，一个在终端中运行的轻量级开源编码代理。它将 o3 和 o4-mini 等模型的力量带入你的本地工作流，使其易于与它们配对以更快完成任务。今天，我们还发布了 codex-1 的较小版本，一个专门为在 Codex CLI 中使用而设计的 o4-mini 版本。这个新模型支持 CLI 中更快的工作流，针对低延迟代码问答和编辑进行了优化，同时保留了指令遵循和风格方面的相同优势。它现在在 Codex CLI 中以默认模型的形式提供，以及在 API 中作为 codex-mini-latest。底层快照将定期更新，因为我们继续改进 Codex-mini 模型。我们还使连接你的开发者帐户到 Codex CLI 变得更容易。无需手动生成和配置 API token，你现在可以使用你的 ChatGPT 帐户登录并选择要使用的 API 组织。我们将自动为你生成和配置 API 密钥。通过 ChatGPT 登录 Codex CLI 的 Plus 和 Pro 用户也可以开始从今天起在接下来的 30 天内获得 $5 和 $50 的免费 API 额度，分别。从今天开始，我们全球向 ChatGPT Pro、Enterprise 和 Business 用户推出 Codex，Plus 和 Edu 用户的支持即将推出。用户在接下来的几周内将获得慷慨的免费访问权限，这样你可以探索 Codex 可以做什么，之后我们将推出速率限制访问和灵活的定价选项，让你按需购买额外使用。我们计划很快扩展对 Plus 和 Edu 用户的访问。对于使用 codex-mini-latest 构建的开发者，该模型在 Responses API 上可用，定价为 $1.50 每百万输入 token 和 $6 每百万输出 token，享有 75% 的提示缓存折扣。 Codex 仍处于开发的早期阶段。作为研究预览版，它目前缺乏图像输入用于前端工作的功能，以及在代理工作时纠正它的能力。此外，委托给远程代理所需的时间比交互式编辑要长，这可能需要一些时间适应。随着时间推移，与 Codex 代理交互将越来越像与同事的异步协作。随着模型能力的进步，我们预期代理将在更长时间内处理更复杂的任务。我们想象一个未来，开发者推动他们想拥有的工作并将其余的委托给代理——移动更快并通过 AI 提高生产力。为了实现这一点，我们正在构建一套 Codex 工具，支持实时协作和异步委托。与 Codex CLI 和其他 AI 工具配对已迅速成为行业规范，帮助开发者在编码时移动更快。但我们相信 Codex 在 ChatGPT 中引入的异步、多代理工作流将成为工程师生成高质量代码的默认方式。最终，我们看到这两种交互模式——实时配对和任务委托——汇聚在一起。开发者将在他们的 IDE 和日常工具中与 AI 代理协作，提出问题、获得建议和卸载较长任务，一切都在统一的工作流中。展望未来，我们计划引入更多交互式和灵活的代理工作流。开发者很快将能够在任务执行中期提供指导、协作实施策略并接收主动进度更新。我们也设想跨你已经使用的工具进行更深层集成：今天 Codex 连接 GitHub，很快你将能够从 Codex CLI、ChatGPT Desktop，甚至工具如你的问题跟踪器或 CI 系统分配任务。软件工程是首批体验显著 AI 驱动生产力收益的行业之一，为个人和小团队打开了新的可能性。虽然我们对这些收益充满乐观，但我们也在与合作伙伴协作，以更好地了解广泛代理采用对开发者工作流、技能在人员、技能水平和地理位置上发展的影响。这只是开始——我们很兴奋地想看到你用 Codex 构建什么。 **系统消息** 我们分享 codex-1 系统消息以帮助开发者理解模型的默认行为并将 Codex 定制为在自定义工作流中有效工作。例如，codex-1 系统消息鼓励 Codex 运行 AGENTS.md 文件中提到的所有测试，但如果时间紧张，你可以要求 Codex 跳过这些测试。

Codex 正式推出

相似文章

什么是 Codex？

Codex 现已正式发布

Codex 升级功能介绍

日常工作场景下的Codex：超越编程的AI代理

OpenAI称Codex即将登陆你的手机

提交意见反馈