网络防御新时代的可信访问

OpenAI Blog 模型

摘要

OpenAI宣布扩大其网络安全可信访问(TAC)计划,并发布GPT-5.4-Cyber,这是一个针对防御性网络安全用例进行微调的变体。

OpenAI扩大其网络安全可信访问计划,向经过审查的防御者推出GPT-5.4-Cyber,并随着AI网络安全能力的进步加强安全保护措施。
查看原文
查看缓存全文

缓存时间: 2026/05/08 09:49

# 面向下一代网络防御的信任访问 来源:https://openai.com/index/scaling-trusted-access-for-cyber-defense/ 我们正在将“网络防御信任访问”(TAC)项目扩展至数千名经过验证的个人防御者,以及数百个负责保护关键软件的团队。多年来,我们始终遵循去中心化访问、迭代部署和生态系统韧性等原则,打造网络安全防御项目。为应对未来几个月 OpenAI 将推出的能力更强的模型,我们正针对防御性网络安全用例对模型进行专门微调——从今天起,推出 GPT-5.4 的一个变种:GPT-5.4-Cyber。在本篇文章中,我们将分享如何预期随着模型能力提升而同步扩展网络防御,以指导未来版本的测试与部署。 AI 的渐进式应用正在加速防御者——那些负责保护系统、数据和用户安全的人——使他们能够更快速地发现并修复数字基础设施中的问题,而这些设施正是所有人所依赖的。同样,AI 也被攻击者 (https://openai.com/global-affairs/disrupting-malicious-uses-of-ai-october-2025/) 用于实施危害。我们一直在为此做准备。自 2023 年起,我们通过网络安全资助计划 (https://openai.com/index/openai-cybersecurity-grant-program/) 支持防御者,并通过准备框架 (https://openai.com/index/updating-our-preparedness-framework/) 强化防护机制。同年,我们开始评估自身模型的网络能力;到 2025 年,我们开始在模型部署 (https://openai.com/index/introducing-gpt-5-2/) 中加入针对网络安全的专门防护措施 (opens in a new window) (https://deploymentsafety.openai.com/gpt-5-3-codex/cybersecurity)。今年早些时候,我们通过发布 Codex Security (https://openai.com/index/codex-security-now-in-research-preview/) 进一步支持防御者,以规模化识别并修复漏洞。我们对能力持续提升的应对策略遵循三项原则: - **去中心化访问:** 我们的目标是尽可能广泛地提供这些工具,同时防止滥用。我们设计了相关机制,避免武断地决定谁可以合法使用、谁不能。这意味着采用清晰、客观的标准和方法——如严格的 KYC 和身份验证——来指导哪些人能够访问 (https://openai.com/index/trusted-access-for-cyber/) 更高级的能力,并随时间推移逐步实现流程自动化。最终,我们致力于让合法行为者——无论规模大小——都能获得先进的防御能力,包括那些负责保护关键基础设施、公共服务以及人们日常依赖的数字系统的人。 - **迭代部署:** 我们通过谨慎地将这些系统引入现实世界 (https://openai.com/safety/how-we-think-about-safety-alignment/) 并持续改进,从而学到最多。随着对能力和风险的理解不断加深,我们相应更新模型与安全系统。这包括理解特定模型的不同收益与风险,提升对越狱及其他对抗性攻击的韧性,并增强防御能力——同时减轻危害。 - **投资生态系统韧性:** 我们通过可信访问路径、定向资助 (https://openai.com/index/openai-cybersecurity-grant-program/)、对开源安全倡议 (opens in a new window) (https://www.linuxfoundation.org/press/linux-foundation-announces-12.5-million-in-grant-funding-from-leading-organizations-to-advance-open-source-security) 的贡献,以及像 Codex Security (https://openai.com/index/codex-security-now-in-research-preview/) 这样的技术——它帮助防御者更快发现并修补漏洞——来支持和加速防御者社区的发展。 **我们的网络安全韧性与防御加速策略** 多年来,我们的网络安全策略一直是:投资研究、防止滥用、加速防御者。随着模型能力的提升,我们已围绕以下信念扩大相关计划: - **网络风险已然存在且正在加速,但我们仍能采取行动。** 在高级 AI 出现之前,数字基础设施 (opens in a new window) (https://www.cisa.gov/news-events/alerts/2017/05/12/indicators-associated-wannacry-ransomware) 早已存在漏洞多年。如今,现有模型能够帮助发现漏洞、跨代码库进行推理,并支持网络工作流中的关键环节;威胁行为者也正在尝试新型 AI 驱动手段。我们已看到,借助现有模型并增加测试时计算量,复杂的工具链能够激发越来越强的能力。这意味着防护措施不能等到某个单一的未来阈值才启动。 - **根据谁在使用这些系统以及如何使用来扩展访问权限。** 网络能力天生具有双重用途,因此风险并非仅由模型本身决定。它还取决于用户、围绕用户的信任信号 (opens in a new window) (https://developers.openai.com/codex/concepts/cyber-safety) 以及他们被赋予的访问权限级别。- 具备防护机制的通才模型的广泛访问,可以与针对高风险能力的更细粒度控制并存,后者需辅以更强的验证、更清晰的意图信号以及更好的使用可见性。- 为实现大规模负责任使用,我们需要能够以更自动化、更客观的方式验证可信用户与用例的系统。这样,我们就能基于证据和真实的信任信号来扩展访问,而非依赖人工决策。我们认为,集中决定谁有权自我防御既不可行也不恰当。相反,我们致力于尽可能赋能合法防御者,其访问基于验证、信任信号和问责制。 - **防御能力应与模型能力同步扩展。** 随着模型能力提升,防御也需要随之扩展。我们已看到编程代理能力的稳步改进,这对网络安全有直接影响,我们也相应地调整了方法。- 我们从 GPT-5.2 开始进行网络专项安全训练,随后通过 GPT-5.3-Codex 和 GPT-5.4 扩展了额外防护措施,并在 GPT-5.4 中根据我们的准备框架将模型归类为“高”网络能力。与此同时,我们加大了对防御者的支持:启动了 1000 万美元的网络安全资助计划 (https://openai.com/form/cybersecurity-grant-program/),通过 Codex for Open Source (opens in a new window) (https://developers.openai.com/community/codex-for-oss) 覆盖超过 1000 个开源项目(提供免费安全扫描),并持续改进 Codex Security。- Codex Security 于六个月前以私有测试版启动,今年早些时候 (https://openai.com/index/codex-security-now-in-research-preview/) 转为研究预览版,能够自动监控代码库、验证问题并提出修复方案。随着模型改进,系统的精确性和实用性也在提升。自最近发布以来,Codex Security 已帮助修复超过 3000 个严重和高危漏洞,以及生态系统中更多低严重性的已修复发现。- 在这些发布过程中,我们还改进了模型处理敏感请求的方式,校准拒绝边界,同时通过 TAC 等项目扩展可信访问。 - **软件开发本身必须变得更加安全。** 最强大的生态系统是那种能在编写软件时持续识别、验证并修复安全问题的系统。通过将高级编程模型和代理能力集成到开发者工作流中,我们可以在开发者构建过程中提供即时、可操作的反馈,将安全从阶段性审计和静态漏洞清单转变为持续的、可量化的风险降低。 ## 扩展网络防御信任访问与 GPT-5.4-Cyber 我们希望赋能防御者,为他们提供前沿能力的广泛访问,包括专为网络安全量身定制的模型。今年二月,我们推出了网络防御信任访问 (https://openai.com/index/trusted-access-for-cyber/)(TAC),为个人提供自动化身份验证以减少网络安全相关任务中防护措施的摩擦,并与有限数量的组织合作提供更偏向网络许可的模型。 今天,我们将通过引入额外的访问层级来扩展该项目,这些层级面向愿意与 OpenAI 合作验证自己为网络安全防御者的用户。最高层级的客户将获得 GPT-5.4-Cyber 的访问权限,这是一个专门为增强网络能力并减少能力限制而微调的模型。它是 GPT-5.4 的一个版本,降低了合法网络安全工作的拒绝边界,并为高级防御工作流启用了新能力,包括二进制逆向工程能力,使安全专业人员能够在无需访问源代码的情况下分析编译后的软件,以评估其恶意软件潜力、漏洞和安全稳健性。 由于该模型更为许可,我们将首先进行有限的迭代部署,面向经过审查的安全供应商、组织和研究人员。对许可型网络能力模型的访问可能附带限制,尤其是在无可见性使用场景下,如零数据保留 (opens in a new window) (https://developers.openai.com/api/docs/guides/your-data#zero-data-retention)(ZDR)。对于通过第三方平台访问我们模型的开发者和组织而言尤其如此,因为 OpenAI 可能无法直接了解用户、环境或请求目的。 获取 TAC 访问权限非常简单: - 个人用户可在 chatgpt.com/cyber (opens in a new window) (http://chatgpt.com/cyber) 验证身份。 - 企业用户可通过其 OpenAI 代表 申请团队可信访问 (https://openai.com/form/enterprise-trusted-access-for-cyber/)。 所有通过此流程获批的客户将获得现有模型的版本,这些版本减少了在双用途网络活动中可能触发的防护摩擦,使他们能够继续支持安全教育、防御性编程和负责任的漏洞研究。已在 TAC 中的客户如愿意进一步验证自己为合法网络防御者,可表达兴趣 (opens in a new window) (https://docs.google.com/forms/d/e/1FAIpQLSea_ptovrS3xZeZ9FoZFkKtEJFWGxNrZb1c52GW4BVjB2KVNA/viewform),申请更高层级访问,包括请求访问 GPT-5.4-Cyber。 ## 展望即将到来的模型发布及未来 我们的网络安全防御是数月迭代改进的成果。我们相信,当前使用的防护机制类别足以充分降低网络风险,从而支持当前模型的广泛部署。我们预计这些防护机制的版本对于即将发布的更强大模型也将足够,而针对网络安全工作显式训练且更许可的模型则需要更严格的部署和适当的控制措施。 长期来看,为确保网络安全中 AI 安全的持续充足性,我们还预计未来模型需要更广泛的防御机制,因为其能力将迅速超越即使是今天最优秀的专用模型。

相似文章

推出Trusted Access for Cyber

OpenAI Blog

OpenAI推出Trusted Access for Cyber,这是一个基于身份和信任的框架,试点开放GPT-5.3-Codex的访问权限,用于防御性网络安全工作,同时承诺提供1000万美元的API积分,以加速网络防御能力并降低滥用风险。

加速保护我们所有人的网络防御生态系统

OpenAI Blog

OpenAI宣布了'Trusted Access for Cyber'计划,向经过审核的组织(包括大型金融机构、安全供应商和政府机构)提供1000万美元的API积分,并允许访问GPT-5.4-Cyber模型,以加速防御性网络安全能力。

随着AI能力提升,强化网络防御能力

OpenAI Blog

OpenAI 发布了一套管理AI模型网络能力的综合框架,指出在 CTF 性能上取得了显著进步(从 GPT-5 的 27% 提升到 GPT-5.1-Codex-Max 的 76%),并概述了纵深防御措施,以确保先进模型主要造福防御方,同时限制恶意使用。