gpt-oss-120b & gpt-oss-20b 模型卡

OpenAI Blog 2025/08/05 00:00 模型

摘要

OpenAI 发布了 gpt-oss-120b 和 gpt-oss-20b，这是两款采用 Apache 2.0 许可证的开权重推理模型，专为智能体工作流设计，具有强大的指令跟随、工具使用和思维链能力。该发布包括全面的安全评估，确认即使在对抗性微调下，这些模型也不会达到生物、化学或网络风险的高能力阈值。

我们推出了 gpt-oss-120b 和 gpt-oss-20b，两款开权重推理模型，可在 Apache 2.0 许可证和我们的 gpt-oss 使用政策下获得。

查看原文

查看缓存全文

缓存时间: 2026/04/20 14:53

# gpt-oss-120b & gpt-oss-20b 模型卡来源：https://openai.com/index/gpt-oss-model-card/ OpenAI 我们推出 gpt-oss-120b 和 gpt-oss-20b，两个开放权重推理模型，采用 Apache 2.0 许可证和我们的 gpt-oss 使用政策发布。这些纯文本模型由开源社区反馈驱动开发，兼容我们的 Responses API，专为代理工作流中使用而设计，具有强大的指令遵循能力、Web 搜索和 Python 代码执行等工具使用功能，以及推理能力——包括针对不需要复杂推理的任务调整推理工作量的能力。这些模型可自定义，提供完整的思维链（CoT），并支持结构化输出。安全是我们开放模型方案的基础。相比专有模型，它们呈现出不同的风险状况：一旦发布，有决心的攻击者可能会对其进行微调以绕过安全拒绝，或直接优化以造成伤害，而 OpenAI 无法实施额外的缓解措施或撤销访问权限。在某些情况下，开发者和企业需要实施额外的防护措施，以复制我们 API 和产品中内置的系统级保护。我们将此文档称为模型卡而非系统卡，因为 gpt-oss 模型将由范围广泛的利益相关者创建和维护的各种系统中使用。虽然这些模型默认设计为遵循 OpenAI 的安全政策，但其他利益相关者也将做出并实施自己的决策，以确保这些系统的安全。我们在 gpt-oss-120b 上进行了可扩展的能力评估，确认默认模型在我们《准备框架》的三个跟踪类别（生物和化学能力、网络能力和 AI 自我改进）中均未达到高能力的指示阈值。我们还调查了两个附加问题： - *对抗性行为者能否通过微调 gpt-oss-120b 在生物和化学或网络领域达到高能力？*通过模拟攻击者的潜在行为，我们对 gpt-oss-120b 模型进行了对抗性微调。OpenAI 安全咨询小组（"SAG"）审查了这一测试，并得出结论：即使采用利用 OpenAI 行业领先训练堆栈的强大微调，gpt-oss-120b 也未能在生物和化学风险或网络风险中达到高能力。 - *发布 gpt-oss-120b 会显著推进开放基础模型的生物能力前沿吗？*我们发现答案是否定的：在大多数评估中，一个或多个现有开放模型的默认性能接近匹配 gpt-oss-120b 的对抗性微调性能。作为此次发布的一部分，OpenAI 重申了其推进有益 AI 和提高整个生态系统安全标准的承诺。

gpt-oss-120b & gpt-oss-20b 模型卡

相似文章

推出 gpt-oss

gpt-oss-safeguard 技术报告

推出 gpt-oss-safeguard

GPT-5.4 Thinking 系统卡

GPT-5.3-Codex 系统卡

提交意见反馈