发布 GPT-5.4 mini 和 nano

OpenAI Blog 2026/03/17 10:00 模型

gpt-5-4 mini-models language-models coding efficiency release

摘要

OpenAI 发布了 GPT-5.4 mini 和 nano，它们是 GPT-5.4 的更小、更快的变体，专为高吞吐量工作负载设计，在编码、推理和多模态理解方面有显著改进，同时保持 2 倍以上的速度提升。

GPT-5.4 mini 和 nano 是 GPT-5.4 的更小、更快的版本，针对编码、工具使用、多模态推理以及高容量 API 和子代理工作负载进行了优化。

查看原文

查看缓存全文

缓存时间: 2026/04/20 14:51

# 推出 GPT‑5.4 mini 和 nano 来源：https://openai.com/index/introducing-gpt-5-4-mini-and-nano/ 今天我们正式发布 GPT‑5.4 mini 和 nano，这是我们迄今为止能力最强的小型模型。它们将 GPT‑5.4 的诸多优势浓缩到更快、更高效的模型中，专为高吞吐量工作负载而设计。 GPT‑5.4 mini 在编码、推理、多模态理解和工具使用方面相较于 GPT‑5 mini 显著提升，同时运行速度提高了 2 倍以上。在多项评估中（包括 SWE-Bench Pro 和 OSWorld-Verified），其性能也接近更大的 GPT‑5.4 模型。 GPT‑5.4 nano 是 GPT‑5.4 系列中最小、最便宜的版本，适用于速度和成本至上的任务。它也是 GPT‑5 nano 的重大升级。我们推荐将其用于分类、数据提取、排序以及处理简单支撑任务的编码子代理。这些模型专为延迟直接影响产品体验的工作负载而构建：需要反应灵敏的编码助手、快速完成支撑任务的子代理、能捕捉并解释截图的计算机使用系统，以及能实时推理图像的多模态应用。在这些场景中，最好的模型往往不是最大的——而是能快速响应、可靠使用工具，同时在复杂专业任务上仍表现良好的模型。 *1 GPT‑5 mini 可用的最高推理力度为 '高'。* 以下是我们客户在各自工作流程中测试 GPT‑5.4 mini 和 nano 后的反馈： GPT‑5.4 mini 和 nano 在需要快速迭代的编码工作流中尤为高效。这些模型能够以低延迟处理针对性编辑、代码库导航、前端生成和调试循环，非常适合需要更快速度和更低成本的编码任务。在基准测试中，GPT‑5.4 mini 在相似延迟下始终优于 GPT‑5 mini，并在远快于 GPT‑5.4 的运行速度下接近其通过率，为编码工作流提供了最强的性能-延迟权衡之一。 *我们通过观察模型的生产行为并离线模拟来估算延迟。延迟估算考虑了工具调用时长（代码执行时间）、采样 token 和输入 token。实际延迟可能差异较大，取决于许多模拟中未捕获的因素。同样，成本基于撰写本文时这些模型的 API 定价进行估算。未来成本可能发生变化。推理力度从低到极高进行了扫描。* GPT‑5.4 mini 也特别适合结合不同规模模型的系统。例如，在 Codex 中，像 GPT‑5.4 这样的较大模型可以负责规划、协调和最终判断，而将更窄的子任务并行委托给 GPT‑5.4 mini 子代理——例如搜索代码库、审查大文件或处理支撑文档。了解子代理在 Codex 中的工作方式，请参阅文档（在新窗口中打开）(https://developers.openai.com/codex/subagents/)。随着小型模型变得更快、能力更强，这种模式变得更加有用。开发者不再使用单一模型处理所有任务，而是构建系统：较大模型决定做什么，较小模型快速大规模执行。GPT‑5.4 mini 是我们迄今为止最适合这种工作流的最强 mini 模型。 GPT‑5.4 mini 在多模态任务上也很强大，尤其是与计算机使用相关的任务。该模型能快速解读密集用户界面截图，以高速度完成计算机使用任务。在 OSWorld-Verified 上，GPT‑5.4 mini 接近 GPT‑5.4，同时大幅超越 GPT‑5 mini。 GPT‑5.4 mini 即日起在 API、Codex 和 ChatGPT 中可用。在 API 中，GPT‑5.4 mini 支持文本和图像输入、工具使用、函数调用、网络搜索、文件搜索、计算机使用和技能。它拥有 400k 上下文窗口，价格为每 100 万输入 token 0.75 美元，每 100 万输出 token 4.50 美元。在 Codex 中，GPT‑5.4 mini 可在 Codex 应用、CLI、IDE 扩展和 Web 中使用。它仅占用 GPT‑5.4 配额的 30%，让开发者能够以约三分之一的成本快速处理 Codex 中较简单的编码任务。Codex 还可以委托给 GPT‑5.4 mini 子代理，使推理密集型较低的工作在更便宜的模型上运行。在 ChatGPT 中，GPT‑5.4 mini 通过“+”菜单中的“思考”功能向免费和 Go 用户提供。对于所有其他用户，GPT‑5.4 mini 作为 GPT‑5.4 思考模式的速率限制后备选项可用。 GPT‑5.4 nano 仅在 API 中提供，价格为每 100 万输入 token 0.20 美元，每 100 万输出 token 1.25 美元。 ##### 编码 ##### 工具调用 ##### 智能 ##### 多模态 / 视觉 / 计算机使用代理 ##### 长上下文 1 GPT‑5 mini 可用的最高推理力度为 '高'。 2 整体编辑距离。OmniDocBench 的推理力度设置为 '无'，以反映低成本、低延迟的性能。

相似文章

面向开发者推出GPT-5.1

OpenAI Blog

OpenAI发布了GPT-5.1，这是GPT-5系列中的一个新模型，它可以基于任务复杂度动态调整思考时间，在保持前沿智能的同时，性能比GPT-5快2-3倍。此次发布包括扩展的提示缓存（24小时保留）、新的编码工具（apply_patch和shell），以及针对延迟敏感应用的“无推理”模式。

为开发者推出 GPT-5

OpenAI Blog

OpenAI 在其 API 平台发布 GPT-5，这是一款最先进的模型，在 SWE-bench Verified 上达到 74.9% 的成绩，在编码、智能体任务和长上下文推理方面表现卓越。此次发布包含三个模型规格（gpt-5、gpt-5-mini、gpt-5-nano）以及新的 API 功能，如详细程度控制、最小推理模式和自定义工具。

在 API 中推出 GPT-4.1

OpenAI Blog

OpenAI 通过 API 推出 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 模型，在编程（SWE-bench 得分达 54.6%）、指令遵循和 100 万 token 上下文窗口方面有重大改进，成本更低。GPT-4.5 Preview 将于 2025 年 7 月 14 日停用。

介绍 GPT-5.4

OpenAI Blog

# 介绍 GPT-5.4 Source: [https://openai.com/index/introducing-gpt-5-4/](https://openai.com/index/introducing-gpt-5-4/) 今天，我们在 ChatGPT（作为 GPT‑5\.4 Thinking）、API 和 Codex 中发布 **GPT‑5\.4**。它是我们用于专业工作的最强大、最高效的前沿模型。我们还将在 ChatGPT 和 API 中发布 **GPT‑5\.4 Pro**，适合希望在复杂任务上获得极致性能的用户。GPT‑5\.4 融合了我们近期在推理、编码和智能体方面的最佳进展。

GPT-4o mini：推进成本高效的智能模型

OpenAI Blog

OpenAI 发布 GPT-4o mini，一款成本高效的小型模型，每百万输入令牌价格仅为 15 美分，比 GPT-3.5 Turbo 便宜 60%，在 MMLU 上表现强劲（82%），在推理、数学和编码任务上超越 Gemini Flash 和 Claude Haiku 等竞争对手。

相似文章

面向开发者推出GPT-5.1

为开发者推出 GPT-5

在 API 中推出 GPT-4.1

介绍 GPT-5.4

GPT-4o mini：推进成本高效的智能模型

提交意见反馈