发布 GPT-5.4 mini 和 nano
摘要
OpenAI 发布了 GPT-5.4 mini 和 nano,它们是 GPT-5.4 的更小、更快的变体,专为高吞吐量工作负载设计,在编码、推理和多模态理解方面有显著改进,同时保持 2 倍以上的速度提升。
GPT-5.4 mini 和 nano 是 GPT-5.4 的更小、更快的版本,针对编码、工具使用、多模态推理以及高容量 API 和子代理工作负载进行了优化。
查看缓存全文
缓存时间:
2026/04/20 14:51
# 推出 GPT‑5.4 mini 和 nano
来源:https://openai.com/index/introducing-gpt-5-4-mini-and-nano/
今天我们正式发布 GPT‑5.4 mini 和 nano,这是我们迄今为止能力最强的小型模型。它们将 GPT‑5.4 的诸多优势浓缩到更快、更高效的模型中,专为高吞吐量工作负载而设计。
GPT‑5.4 mini 在编码、推理、多模态理解和工具使用方面相较于 GPT‑5 mini 显著提升,同时运行速度提高了 2 倍以上。在多项评估中(包括 SWE-Bench Pro 和 OSWorld-Verified),其性能也接近更大的 GPT‑5.4 模型。
GPT‑5.4 nano 是 GPT‑5.4 系列中最小、最便宜的版本,适用于速度和成本至上的任务。它也是 GPT‑5 nano 的重大升级。我们推荐将其用于分类、数据提取、排序以及处理简单支撑任务的编码子代理。
这些模型专为延迟直接影响产品体验的工作负载而构建:需要反应灵敏的编码助手、快速完成支撑任务的子代理、能捕捉并解释截图的计算机使用系统,以及能实时推理图像的多模态应用。在这些场景中,最好的模型往往不是最大的——而是能快速响应、可靠使用工具,同时在复杂专业任务上仍表现良好的模型。
*1 GPT‑5 mini 可用的最高推理力度为 '高'。*
以下是我们客户在各自工作流程中测试 GPT‑5.4 mini 和 nano 后的反馈:
GPT‑5.4 mini 和 nano 在需要快速迭代的编码工作流中尤为高效。这些模型能够以低延迟处理针对性编辑、代码库导航、前端生成和调试循环,非常适合需要更快速度和更低成本的编码任务。
在基准测试中,GPT‑5.4 mini 在相似延迟下始终优于 GPT‑5 mini,并在远快于 GPT‑5.4 的运行速度下接近其通过率,为编码工作流提供了最强的性能-延迟权衡之一。
*我们通过观察模型的生产行为并离线模拟来估算延迟。延迟估算考虑了工具调用时长(代码执行时间)、采样 token 和输入 token。实际延迟可能差异较大,取决于许多模拟中未捕获的因素。同样,成本基于撰写本文时这些模型的 API 定价进行估算。未来成本可能发生变化。推理力度从低到极高进行了扫描。*
GPT‑5.4 mini 也特别适合结合不同规模模型的系统。例如,在 Codex 中,像 GPT‑5.4 这样的较大模型可以负责规划、协调和最终判断,而将更窄的子任务并行委托给 GPT‑5.4 mini 子代理——例如搜索代码库、审查大文件或处理支撑文档。了解子代理在 Codex 中的工作方式,请参阅文档(在新窗口中打开)(https://developers.openai.com/codex/subagents/)。
随着小型模型变得更快、能力更强,这种模式变得更加有用。开发者不再使用单一模型处理所有任务,而是构建系统:较大模型决定做什么,较小模型快速大规模执行。GPT‑5.4 mini 是我们迄今为止最适合这种工作流的最强 mini 模型。
GPT‑5.4 mini 在多模态任务上也很强大,尤其是与计算机使用相关的任务。该模型能快速解读密集用户界面截图,以高速度完成计算机使用任务。在 OSWorld-Verified 上,GPT‑5.4 mini 接近 GPT‑5.4,同时大幅超越 GPT‑5 mini。
GPT‑5.4 mini 即日起在 API、Codex 和 ChatGPT 中可用。
在 API 中,GPT‑5.4 mini 支持文本和图像输入、工具使用、函数调用、网络搜索、文件搜索、计算机使用和技能。它拥有 400k 上下文窗口,价格为每 100 万输入 token 0.75 美元,每 100 万输出 token 4.50 美元。
在 Codex 中,GPT‑5.4 mini 可在 Codex 应用、CLI、IDE 扩展和 Web 中使用。它仅占用 GPT‑5.4 配额的 30%,让开发者能够以约三分之一的成本快速处理 Codex 中较简单的编码任务。Codex 还可以委托给 GPT‑5.4 mini 子代理,使推理密集型较低的工作在更便宜的模型上运行。
在 ChatGPT 中,GPT‑5.4 mini 通过“+”菜单中的“思考”功能向免费和 Go 用户提供。对于所有其他用户,GPT‑5.4 mini 作为 GPT‑5.4 思考模式的速率限制后备选项可用。
GPT‑5.4 nano 仅在 API 中提供,价格为每 100 万输入 token 0.20 美元,每 100 万输出 token 1.25 美元。
##### 编码
##### 工具调用
##### 智能
##### 多模态 / 视觉 / 计算机使用代理
##### 长上下文
1 GPT‑5 mini 可用的最高推理力度为 '高'。
2 整体编辑距离。OmniDocBench 的推理力度设置为 '无',以反映低成本、低延迟的性能。
相似文章
OpenAI Blog
OpenAI发布了GPT-5.1,这是GPT-5系列中的一个新模型,它可以基于任务复杂度动态调整思考时间,在保持前沿智能的同时,性能比GPT-5快2-3倍。此次发布包括扩展的提示缓存(24小时保留)、新的编码工具(apply_patch和shell),以及针对延迟敏感应用的“无推理”模式。
OpenAI Blog
OpenAI 在其 API 平台发布 GPT-5,这是一款最先进的模型,在 SWE-bench Verified 上达到 74.9% 的成绩,在编码、智能体任务和长上下文推理方面表现卓越。此次发布包含三个模型规格(gpt-5、gpt-5-mini、gpt-5-nano)以及新的 API 功能,如详细程度控制、最小推理模式和自定义工具。
OpenAI Blog
OpenAI 通过 API 推出 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 模型,在编程(SWE-bench 得分达 54.6%)、指令遵循和 100 万 token 上下文窗口方面有重大改进,成本更低。GPT-4.5 Preview 将于 2025 年 7 月 14 日停用。
OpenAI Blog
# 介绍 GPT-5.4
Source: [https://openai.com/index/introducing-gpt-5-4/](https://openai.com/index/introducing-gpt-5-4/)
今天,我们在 ChatGPT(作为 GPT‑5\.4 Thinking)、API 和 Codex 中发布 **GPT‑5\.4**。它是我们用于专业工作的最强大、最高效的前沿模型。我们还将在 ChatGPT 和 API 中发布 **GPT‑5\.4 Pro**,适合希望在复杂任务上获得极致性能的用户。GPT‑5\.4 融合了我们近期在推理、编码和智能体方面的最佳进展。
OpenAI Blog
OpenAI 发布 GPT-4o mini,一款成本高效的小型模型,每百万输入令牌价格仅为 15 美分,比 GPT-3.5 Turbo 便宜 60%,在 MMLU 上表现强劲(82%),在推理、数学和编码任务上超越 Gemini Flash 和 Claude Haiku 等竞争对手。