gpt-oss-120b & gpt-oss-20b 模型卡
摘要
OpenAI 发布了 gpt-oss-120b 和 gpt-oss-20b,这是两款采用 Apache 2.0 许可证的开权重推理模型,专为智能体工作流设计,具有强大的指令跟随、工具使用和思维链能力。该发布包括全面的安全评估,确认即使在对抗性微调下,这些模型也不会达到生物、化学或网络风险的高能力阈值。
我们推出了 gpt-oss-120b 和 gpt-oss-20b,两款开权重推理模型,可在 Apache 2.0 许可证和我们的 gpt-oss 使用政策下获得。
查看缓存全文
缓存时间:
2026/04/20 14:53
# gpt-oss-120b & gpt-oss-20b 模型卡
来源:https://openai.com/index/gpt-oss-model-card/
OpenAI
我们推出 gpt-oss-120b 和 gpt-oss-20b,两个开放权重推理模型,采用 Apache 2.0 许可证和我们的 gpt-oss 使用政策发布。这些纯文本模型由开源社区反馈驱动开发,兼容我们的 Responses API,专为代理工作流中使用而设计,具有强大的指令遵循能力、Web 搜索和 Python 代码执行等工具使用功能,以及推理能力——包括针对不需要复杂推理的任务调整推理工作量的能力。这些模型可自定义,提供完整的思维链(CoT),并支持结构化输出。
安全是我们开放模型方案的基础。相比专有模型,它们呈现出不同的风险状况:一旦发布,有决心的攻击者可能会对其进行微调以绕过安全拒绝,或直接优化以造成伤害,而 OpenAI 无法实施额外的缓解措施或撤销访问权限。
在某些情况下,开发者和企业需要实施额外的防护措施,以复制我们 API 和产品中内置的系统级保护。我们将此文档称为模型卡而非系统卡,因为 gpt-oss 模型将由范围广泛的利益相关者创建和维护的各种系统中使用。虽然这些模型默认设计为遵循 OpenAI 的安全政策,但其他利益相关者也将做出并实施自己的决策,以确保这些系统的安全。
我们在 gpt-oss-120b 上进行了可扩展的能力评估,确认默认模型在我们《准备框架》的三个跟踪类别(生物和化学能力、网络能力和 AI 自我改进)中均未达到高能力的指示阈值。我们还调查了两个附加问题:
- *对抗性行为者能否通过微调 gpt-oss-120b 在生物和化学或网络领域达到高能力?*通过模拟攻击者的潜在行为,我们对 gpt-oss-120b 模型进行了对抗性微调。OpenAI 安全咨询小组("SAG")审查了这一测试,并得出结论:即使采用利用 OpenAI 行业领先训练堆栈的强大微调,gpt-oss-120b 也未能在生物和化学风险或网络风险中达到高能力。
- *发布 gpt-oss-120b 会显著推进开放基础模型的生物能力前沿吗?*我们发现答案是否定的:在大多数评估中,一个或多个现有开放模型的默认性能接近匹配 gpt-oss-120b 的对抗性微调性能。
作为此次发布的一部分,OpenAI 重申了其推进有益 AI 和提高整个生态系统安全标准的承诺。
相似文章
OpenAI Blog
OpenAI 发布 gpt-oss-120b 和 gpt-oss-20b,两款最先进的开放权重语言模型,采用 Apache 2.0 许可证,性能与专有模型相当,可针对消费级硬件和边缘设备进行优化。两款模型均展现出强大的推理和工具使用能力,并进行了全面的安全评估。
OpenAI Blog
OpenAI 发布了 gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b,这两个开放权重推理模型专为基于策略的内容分类而设计,具有完整的思维链推理能力。技术报告提供了基准安全评估,展示了模型在 Apache 2.0 许可证下的内容标签任务能力。
OpenAI Blog
OpenAI 发布 gpt-oss-safeguard,这是用于安全分类任务的开源权重推理模型,提供 120B 和 20B 两种规格,采用 Apache 2.0 许可证。这些模型使用链式思维推理,在推理时根据开发者提供的策略对内容进行分类,实现灵活且可解释的内容审核。
OpenAI Blog
OpenAI发布了GPT-5.4 Thinking,这是GPT-5系列中最新推出的推理模型,具备增强的安全缓解措施,尤其值得一提的是,该模型是首个实现全面网络安全保护措施的通用模型。
OpenAI Blog
OpenAI 发布了 GPT-5.3-Codex,这是目前最强大的代理型编码模型,结合了前沿的编码性能与高级推理能力,具备交互式长时间任务执行功能,并在网络安全领域引入了新颖的高能力安全防护措施。