GPT-5.3-Codex-Spark 发布
摘要
# GPT-5.3-Codex-Spark 发布 来源:[https://openai.com/index/introducing-gpt-5-3-codex-spark/](https://openai.com/index/introducing-gpt-5-3-codex-spark/) 今天,我们发布了 GPT‑5\.3‑Codex‑Spark 的研究预览版。这是 GPT‑5\.3‑Codex 的一个更小版本,也是我们首个专为实时编码设计的模型。Codex‑Spark 标志着我们与 Cerebras 合作关系[于 1 月宣布](https://openai.com/index/cerebras-partnership/)的第一个里程碑。Codex‑Spark 针对实时编码进行了优化。
GPT-5.3-Codex-Spark 发布——我们的首个实时编码模型。生成速度提升 15 倍,支持 128k 上下文,现已面向 ChatGPT Pro 用户提供研究预览。
查看缓存全文
缓存时间:
2026/04/20 14:52
# 介绍 GPT-5.3-Codex-Spark
来源:https://openai.com/index/introducing-gpt-5-3-codex-spark/
今天,我们发布 GPT‑5.3‑Codex‑Spark 的研究预览版。它是 GPT‑5.3‑Codex 的一个小尺寸版本,也是我们为实时编程而设计的首个模型。Codex‑Spark 标志着我们与 Cerebras 合作的第一个里程碑,该合作于今年一月公布(https://openai.com/index/cerebras-partnership/)。Codex‑Spark 经过优化,在超低延迟硬件上运行时几乎能瞬时响应——每秒可生成超过 1000 个 token,同时在实际编程任务中保持强大能力。
我们通过 Cerebras 将 Codex‑Spark 作为研究预览版提供给 ChatGPT Pro 用户,以便开发者能尽早开始试验;与此同时,我们正与 Cerebras 合作扩大数据中心容量、强化端到端用户体验,并部署我们更大的前沿模型。
我们最新的前沿模型在长时间运行任务方面展现出独特优势——能够自主工作数小时、数天甚至数周而不需人工干预。Codex‑Spark 是我们首个专为与 Codex 实时协作而设计的模型——它能进行有针对性的编辑、重构逻辑或优化界面,并让您立即看到结果。借助 Codex‑Spark,Codex 现在既能处理长期、宏大的任务,也能满足即时完成工作所需。我们希望从开发者的使用方式中学习,并吸纳反馈,以持续扩大访问范围。
上线时,Codex‑Spark 拥有 128k 上下文窗口,且仅支持文本。在研究预览期间,Codex‑Spark 将拥有独立的使用速率限制,其用量不计入标准速率限制。然而,当需求较高时,您可能会遇到访问受限或临时排队的情况,这是为了平衡各用户的可靠性。
Codex‑Spark 专为交互式工作而优化,在这种场景下,延迟与智能同等重要。您可以与模型实时协作,在它工作时随时打断或调整方向,并通过近乎瞬时的响应快速迭代。由于 Codex‑Spark 专为速度而调优,其默认工作风格轻量化:它只进行最小且有目标的编辑,除非您要求,否则不会自动运行测试。
Codex‑Spark 是一个能力强劲的小模型,针对快速推理进行了优化。在评估代理型软件工程能力的 SWE-Bench Pro 和 Terminal-Bench 2.0 两项基准测试中,GPT‑5.3‑Codex‑Spark 展现了强大的性能,同时完成任务的时间仅为 GPT‑5.3‑Codex 的一小部分。
持续时间估算为以下之和:(1) 输出生成时间(输出 token ÷ 采样速度),(2) 预填充时间(预填充 token ÷ 预填充速度),(3) 工具执行总时间,(4) 总网络开销。
在训练 Codex‑Spark 的过程中,我们意识到模型速度只是实时协作方程式的一部分——我们还需要降低整个请求-响应管道的延迟。我们在实现框架中应用了端到端的延迟改进,这些改进将使所有模型受益。在底层,我们优化了响应在客户端与服务器之间的流式传输方式,重写了推理栈的关键部分,并重新设计了会话初始化流程,使首个可见 token 出现得更快,同时让 Codex 在您迭代过程中保持响应能力。通过引入持久化的 WebSocket 连接以及对 Responses API 进行针对性优化,我们将每次客户-服务器往返的开销降低了 80%,每个 token 的开销降低了 30%,首 token 到达时间降低了 50%。WebSocket 路径在 Codex‑Spark 中默认启用,并将在不久后成为所有模型的默认路径。
Codex‑Spark 运行在 Cerebras 的 Wafer Scale Engine 3(在新窗口中打开)(https://www.cerebras.ai/chip)上——这是一款专为高速推理而构建的 AI 加速器,为 Codex 提供了延迟优先的服务层。我们与 Cerebras 合作,将这条低延迟路径集成到与我们其他模型相同的生产服务栈中,使其在 Codex 中无缝工作,并为未来模型的支持奠定了基础。
> “GPT‑5.3‑Codex‑Spark 最让我们兴奋的是,能与 OpenAI 及开发者社区共同探索快速推理带来的可能性——新的交互模式、新的用例,以及完全不同的模型体验。这个预览版仅仅是个开始。”
>
> — Sean Lie,Cerebras 联合创始人兼首席技术官
GPU 在我们的训练和推理管道中仍处于基础地位,并且能为广泛使用提供最具成本效益的 token。Cerebras 则通过擅长需要极低延迟的工作流来补充这一基础,它收紧了端到端循环,使 Codex 在您迭代时感觉更灵敏。GPU 和 Cerebras 可以组合用于单一工作负载,以达到最佳性能。
Codex‑Spark 今天以研究预览版的形式面向 ChatGPT Pro 用户推出,可在最新版本的 Codex 应用、CLI 和 VS Code 扩展中使用。由于它运行在专用低延迟硬件上,其使用受单独的速率限制控制,该限制在研究预览期间可能会根据需求调整。此外,我们正在 API 中向一小部分设计合作伙伴提供 Codex‑Spark,以了解开发者希望如何将 Codex‑Spark 集成到他们的产品中。随着我们在实际工作负载下持续优化集成,将在未来几周内扩大访问范围。
Codex‑Spark 目前仅支持文本,上下文窗口为 128k,是超快模型家族中的首个成员。随着我们与开发者社区共同探索快速模型在编程中的优势,我们将引入更多能力——包括更大的模型、更长的上下文长度以及多模态输入。
Codex‑Spark 包含与我们主线模型相同的安全训练,包括与网络安全相关的训练。我们按照标准部署流程对 Codex‑Spark 进行了评估,其中包括对网络安全及其他能力的基线评估,并判定它没有合理可能达到我们准备框架中关于网络安全或生物学高能力阈值。
Codex‑Spark 是 Codex 迈向两种互补模式的第一步:长周期推理与执行,以及用于快速迭代的实时协作。随着时间的推移,这两种模式将融合——Codex 可以让你保持紧密的交互循环,同时将长时间运行的工作委托给后台的子代理,或者当你需要广度与速度时,将任务并行分发给多个模型,这样你就不必预先选择单一模式。
随着模型能力越来越强,交互速度成为明显的瓶颈。超快推理收紧了这一循环,使 Codex 使用起来更加自然,并为任何将创意转化为实际软件的人拓展了可能性。
相似文章
OpenAI Blog
OpenAI 发布了 GPT-5.2-Codex,这是一个先进的代理型编码模型,针对复杂软件工程任务进行了优化,在长上下文理解、Windows 支持和网络安全能力方面有所改进。该模型在 SWE-Bench Pro 和 Terminal-Bench 2.0 上取得了最先进的性能,现已向付费 ChatGPT 用户开放,API 访问将在未来几周内提供。
OpenAI Blog
OpenAI 推出 GPT-5.3-Codex,这是一款先进的智能编程模型,融合了前沿编程能力、推理能力和专业知识,在 SWE-Bench Pro 和 Terminal-Bench 上实现了最先进的性能,同时比前代模型快 25%。
OpenAI Blog
# 介绍 GPT-5.4
Source: [https://openai.com/index/introducing-gpt-5-4/](https://openai.com/index/introducing-gpt-5-4/)
今天,我们在 ChatGPT(作为 GPT‑5\.4 Thinking)、API 和 Codex 中发布 **GPT‑5\.4**。它是我们用于专业工作的最强大、最高效的前沿模型。我们还将在 ChatGPT 和 API 中发布 **GPT‑5\.4 Pro**,适合希望在复杂任务上获得极致性能的用户。GPT‑5\.4 融合了我们近期在推理、编码和智能体方面的最佳进展。
OpenAI Blog
# GPT-5 系统卡补充:GPT-5-Codex 来源:[https://openai.com/index/gpt-5-system-card-addendum-gpt-5-codex/](https://openai.com/index/gpt-5-system-card-addendum-gpt-5-codex/) GPT-5-Codex 是 GPT-5 的一个版本,针对 Codex 中的代理编码进行了优化。与其前身 codex-1 一样,该模型采用强化学习方法在各种环境中的真实编码任务上进行了训练,以生成与人类编码风格和 PR 偏好相近的代码,并精确遵循指令
OpenAI Blog
OpenAI 推出 GPT-5.1-Codex-Max,这是一款新的智能代理编码模型,具有改进的推理能力、token 效率,以及通过“压缩”机制在数百万个 token 上保持连贯工作的能力。该模型更快速、更智能,可以持续运行数小时甚至数天的长时间任务,代表了 AI 辅助软件工程的重大进步。