GPT-5 系统卡

OpenAI Blog 模型

摘要

OpenAI 发布 GPT-5 系统卡,详细说明了一个统一系统,包含快速主模型和深度推理模型,根据对话类型和复杂性智能路由,在幻觉减少、指令跟随和写作、编码和健康领域的实际应用方面取得显著进展。

本 GPT-5 系统卡说明了统一的模型路由系统如何利用 gpt-5-main、gpt-5-thinking 和 gpt-5-thinking-nano 等轻量级版本提供快速、智能的响应,针对不同的任务和开发者需求进行了优化。
查看原文
查看缓存全文

缓存时间: 2026/04/20 14:47

# GPT-5 系统卡 来源:https://openai.com/index/gpt-5-system-card/ GPT-5 是一个统一的系统,包含一个聪慧快速的模型来回答大多数问题,一个用于处理更难问题的深度推理模型,以及一个实时路由器,它能根据对话类型、复杂度、工具需求和明确意图(例如,如果你在提示中说"仔细思考这个")快速决定使用哪个模型。路由器通过真实信号不断训练,包括用户切换模型的情况、响应偏好率和测量的正确率,随着时间推移不断改进。一旦达到使用限制,每个模型的迷你版本会处理剩余的查询。在不久的将来,我们计划将这些功能整合到单个模型中。 在本系统卡中,我们将快速、高吞吐量模型标记为 gpt-5-main 和 gpt-5-main-mini,将思维模型标记为 gpt-5-thinking 和 gpt-5-thinking-mini。在 API 中,我们提供对思维模型、其迷你版本,以及为开发者设计的更小更快的 nano 版本思维模型 (gpt-5-thinking-nano) 的直接访问。在 ChatGPT 中,我们也通过使用并行测试时计算的设置提供 gpt-5-thinking 的访问;我们将其称为 gpt-5-thinking-pro。 可以将 GPT-5 模型看作之前模型的继任者会很有帮助: 本系统卡主要关注 gpt-5-thinking 和 gpt-5-main,其他模型的评估可在附录中找到。GPT-5 系统不仅在基准测试中表现优于之前的模型,回答问题也更快,但更重要的是,它对真实世界的查询更加有用。我们在减少幻觉、改进指令遵循和最小化逢迎方面取得了重大进展,并在 ChatGPT 最常见的三个用途上提升了 GPT-5 的性能:写作、编码和健康。所有 GPT-5 模型还配备了安全完成功能,这是我们最新的安全训练方法,用于防止不允许的内容。 与 ChatGPT agent 类似,我们已决定根据我们的 [防范框架](https://openai.com/index/updating-our-preparedness-framework/) 将 gpt-5-thinking 视为生物和化学领域的高能力,启用相关的安全措施。虽然我们没有明确证据表明该模型可能会帮助新手造成严重的生物危害——我们定义的 [高能力阈值](https://cdn.openai.com/pdf/18a02b5d-6b67-4cec-ab64-68cdfbddebcd/preparedness-framework-v2.pdf)——但我们已选择采取谨慎态度。

相似文章

GPT-5.5 系统卡

OpenAI Blog

OpenAI 发布 GPT-5.5 系统卡,这是一款专为复杂真实世界任务设计的新模型,具备增强的工具使用能力、自我纠错能力以及稳健的安全保障措施。

GPT-5.4 Thinking 系统卡

OpenAI Blog

OpenAI发布了GPT-5.4 Thinking,这是GPT-5系列中最新推出的推理模型,具备增强的安全缓解措施,尤其值得一提的是,该模型是首个实现全面网络安全保护措施的通用模型。

OpenAI GPT-4.5 System Card

OpenAI Blog

# GPT-4.5 系统卡 来源:[https://openai.com/index/gpt-4-5-system-card/](https://openai.com/index/gpt-4-5-system-card/) 我们正在发布 OpenAI GPT-4.5 的研究预览版,这是我们迄今为止规模最大、知识最丰富的模型。GPT-4.5 建立在 GPT-4o 的基础上,进一步扩展了预训练规模,设计目标是比我们强大的 STEM 焦点推理模型具有更广泛的适用性。我们采用新的监督技术结合传统方法(如监督微调 (SFT))来训练该模型

GPT-5.1-Codex-Max 系统卡

OpenAI Blog

OpenAI 发布了 GPT-5.1-Codex-Max,这是一款前沿的智能体编码模型,针对软件工程任务进行了训练,通过压缩技术支持原生多上下文窗口,能够在单个任务中处理数百万个令牌。系统卡详细说明了在网络安全、生物学和 AI 自我改进等领域的全面安全措施和准备情况框架评估。