gpt-oss-120b & gpt-oss-20b 模型卡

OpenAI Blog 模型

摘要

OpenAI 发布了 gpt-oss-120b 和 gpt-oss-20b,这是两款采用 Apache 2.0 许可证的开权重推理模型,专为智能体工作流设计,具有强大的指令跟随、工具使用和思维链能力。该发布包括全面的安全评估,确认即使在对抗性微调下,这些模型也不会达到生物、化学或网络风险的高能力阈值。

我们推出了 gpt-oss-120b 和 gpt-oss-20b,两款开权重推理模型,可在 Apache 2.0 许可证和我们的 gpt-oss 使用政策下获得。
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/04/20 14:53

# gpt-oss-120b & gpt-oss-20b 模型卡 来源:https://openai.com/index/gpt-oss-model-card/ OpenAI 我们推出 gpt-oss-120b 和 gpt-oss-20b,两个开放权重推理模型,采用 Apache 2.0 许可证和我们的 gpt-oss 使用政策发布。这些纯文本模型由开源社区反馈驱动开发,兼容我们的 Responses API,专为代理工作流中使用而设计,具有强大的指令遵循能力、Web 搜索和 Python 代码执行等工具使用功能,以及推理能力——包括针对不需要复杂推理的任务调整推理工作量的能力。这些模型可自定义,提供完整的思维链(CoT),并支持结构化输出。 安全是我们开放模型方案的基础。相比专有模型,它们呈现出不同的风险状况:一旦发布,有决心的攻击者可能会对其进行微调以绕过安全拒绝,或直接优化以造成伤害,而 OpenAI 无法实施额外的缓解措施或撤销访问权限。 在某些情况下,开发者和企业需要实施额外的防护措施,以复制我们 API 和产品中内置的系统级保护。我们将此文档称为模型卡而非系统卡,因为 gpt-oss 模型将由范围广泛的利益相关者创建和维护的各种系统中使用。虽然这些模型默认设计为遵循 OpenAI 的安全政策,但其他利益相关者也将做出并实施自己的决策,以确保这些系统的安全。 我们在 gpt-oss-120b 上进行了可扩展的能力评估,确认默认模型在我们《准备框架》的三个跟踪类别(生物和化学能力、网络能力和 AI 自我改进)中均未达到高能力的指示阈值。我们还调查了两个附加问题: - *对抗性行为者能否通过微调 gpt-oss-120b 在生物和化学或网络领域达到高能力?*通过模拟攻击者的潜在行为,我们对 gpt-oss-120b 模型进行了对抗性微调。OpenAI 安全咨询小组("SAG")审查了这一测试,并得出结论:即使采用利用 OpenAI 行业领先训练堆栈的强大微调,gpt-oss-120b 也未能在生物和化学风险或网络风险中达到高能力。 - *发布 gpt-oss-120b 会显著推进开放基础模型的生物能力前沿吗?*我们发现答案是否定的:在大多数评估中,一个或多个现有开放模型的默认性能接近匹配 gpt-oss-120b 的对抗性微调性能。 作为此次发布的一部分,OpenAI 重申了其推进有益 AI 和提高整个生态系统安全标准的承诺。

相似文章

推出 gpt-oss

OpenAI Blog

OpenAI 发布 gpt-oss-120b 和 gpt-oss-20b,两款最先进的开放权重语言模型,采用 Apache 2.0 许可证,性能与专有模型相当,可针对消费级硬件和边缘设备进行优化。两款模型均展现出强大的推理和工具使用能力,并进行了全面的安全评估。

gpt-oss-safeguard 技术报告

OpenAI Blog

OpenAI 发布了 gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b,这两个开放权重推理模型专为基于策略的内容分类而设计,具有完整的思维链推理能力。技术报告提供了基准安全评估,展示了模型在 Apache 2.0 许可证下的内容标签任务能力。

推出 gpt-oss-safeguard

OpenAI Blog

OpenAI 发布 gpt-oss-safeguard,这是用于安全分类任务的开源权重推理模型,提供 120B 和 20B 两种规格,采用 Apache 2.0 许可证。这些模型使用链式思维推理,在推理时根据开发者提供的策略对内容进行分类,实现灵活且可解释的内容审核。

GPT-5.4 Thinking 系统卡

OpenAI Blog

OpenAI发布了GPT-5.4 Thinking,这是GPT-5系列中最新推出的推理模型,具备增强的安全缓解措施,尤其值得一提的是,该模型是首个实现全面网络安全保护措施的通用模型。

GPT-5.3-Codex 系统卡

OpenAI Blog

OpenAI 发布了 GPT-5.3-Codex,这是目前最强大的代理型编码模型,结合了前沿的编码性能与高级推理能力,具备交互式长时间任务执行功能,并在网络安全领域引入了新颖的高能力安全防护措施。