ChatGPT 推出锁定模式和风险标签

OpenAI Blog 产品

摘要

OpenAI 在 ChatGPT 中引入锁定模式和风险标签,以防止提示注入攻击并保护敏感数据。锁定模式是为高风险用户提供的高级安全设置,可限制 ChatGPT 与外部系统的交互,目前提供给企业计划使用,未来将向消费者推出。

ChatGPT 推出锁定模式和风险标签,帮助组织防御提示注入和 AI 驱动的数据泄露。
查看原文
查看缓存全文

缓存时间: 2026/04/20 14:50

# 在 ChatGPT 中推出"锁定模式"和"提升风险"标签 来源:https://openai.com/index/introducing-lockdown-mode-and-elevated-risk-labels-in-chatgpt/ 随着 AI 系统承担更复杂的任务——尤其是涉及网络和连接应用的任务——安全风险也随之改变。 一个新兴风险变得尤为重要:**提示词注入**(https://openai.com/index/prompt-injections/)。在这类攻击中,第三方试图欺骗对话式 AI 系统执行恶意指令或泄露敏感信息。 今天,我们推出两项新的保护措施,旨在帮助用户和组织减轻提示词注入攻击的威胁,同时提供更清晰的风险可见性和更强大的控制: - **ChatGPT 中的"锁定模式"**——为高风险用户设计的高级可选安全设置 - **"提升风险"标签**——适用于 ChatGPT、ChatGPT Atlas 和 Codex 中可能引入额外风险的特定功能 锁定模式是一项可选的高级安全设置,专为一小部分安全意识强的用户而设计——例如知名组织中的高管或安全团队——他们需要针对高级威胁的增强保护。大多数用户不需要此功能。锁定模式严格限制 ChatGPT 与外部系统的交互方式,以降低基于提示词注入的数据泄露风险。 锁定模式确定性地禁用了 ChatGPT 中的某些工具和功能,攻击者可能会尝试利用这些工具和功能通过提示词注入等攻击从用户对话或连接应用中窃取敏感数据。 例如,锁定模式中的网络浏览仅限于缓存内容,因此没有实时网络请求离开 OpenAI 的受控网络。此限制旨在防止敏感数据通过浏览器泄露给攻击者。对于我们无法提供强有力的确定性数据安全保证的某些功能,会被完全禁用。 锁定模式是一项新的确定性设置,通过严格限制 ChatGPT 与特定外部系统的交互方式,帮助防止数据被无意中与第三方共享。 ChatGPT 商业计划已经提供[企业级数据安全](https://openai.com/business-data/)。锁定模式在这些保护的基础上进一步增强,适用于 ChatGPT Enterprise、ChatGPT Edu、ChatGPT for Healthcare 和 ChatGPT for Teachers。管理员可以通过在[工作区设置](https://chatgpt.com/admin/permissions?tab=roles)中创建[新角色](https://help.openai.com/en/articles/11750701-rbac)来启用它。启用后,锁定模式会在现有的管理员设置基础上添加额外限制。 由于某些关键工作流程依赖应用,工作区管理员保持更精细的控制权。他们可以精确选择哪些应用——以及这些应用中的哪些特定操作——在锁定模式下对用户可用。此外,独立于锁定模式之外,[合规 API 日志平台](https://help.openai.com/en/articles/9261474-compliance-api-for-enterprise-customers)提供了关于应用使用情况、共享数据和连接源的详细可见性,帮助管理员保持监管。 我们计划在未来几个月内向消费者提供锁定模式。 当 AI 产品连接到你的应用和网络时,它们会更加有用,我们已在[确保连接数据安全](https://openai.com/safety/prompt-injections/)方面投入了大量资源。与此同时,某些与网络相关的功能引入的新风险尚未被业界的安全和保障措施完全解决。某些用户可能愿意承担这些风险,我们认为用户能够决定是否以及如何使用这些功能是很重要的,尤其是在处理私人数据时。 我们的方法是为可能引入额外风险的功能提供产品内指导。为了使这一点更清晰和更一致,我们正在标准化如何标记一些现有功能的方式。这些功能现在将在 ChatGPT、ChatGPT Atlas 和 Codex 中使用一致的"提升风险"标签,以便用户在任何地方遇到它们时都能获得相同的指导。 例如,在我们的编码助手 Codex 中,开发者可以授予 Codex 网络访问权限,使其能够在网络上执行操作,如查找文档。相关的设置屏幕包含"提升风险"标签,以及关于什么会改变、可能引入什么风险以及何时适合使用该访问权限的清晰说明。 ![Codex 设置屏幕的截图,显示"代理网络访问"设置面板,切换开启,展示了域名白名单、其他允许域名(包括 openai.com)、允许的 HTTP 方法选项,以及一条突出显示的警告,指出启用网络访问时存在的提升安全风险。](https://openai.com/index/introducing-lockdown-mode-and-elevated-risk-labels-in-chatgpt/) 这是 Codex 设置屏幕的截图,用户可以在其中配置 Codex 拥有的网络访问权限。 我们继续投资于加强我们的安全和保障措施,尤其是针对新颖、新兴或增长中的风险。随着我们为这些功能强化保障措施,一旦我们确定安全进步已充分减轻了这些风险,使其适合普遍使用,我们将移除"提升风险"标签。我们还将继续随时间更新哪些功能带有此标签,以更好地向用户传达风险。

相似文章

OpenAI 推出锁定模式,保护敏感数据免受提示注入攻击

TechCrunch AI

OpenAI 宣布为 ChatGPT 推出锁定模式,该新功能通过禁用实时网页浏览、图片检索、深度研究和代理模式,提供针对提示注入攻击的额外保护。该功能专为处理敏感数据的用户设计,正在向企业版及符合条件的个人账户推出。

OpenAI 帮助:Lockdown Mode

Simon Willison's Blog

OpenAI 已为 ChatGPT 推出了 Lockdown Mode,通过限制出站网络请求来防止因提示注入攻击导致的数据泄露。该功能正在向符合条件的账户(包括 Free、Plus、Pro 和自助服务 Business 用户)推出。

OpenAI 添加锁定模式(3分钟阅读)

TLDR AI

OpenAI 推出了锁定模式,这是一项可选的安全设置,用于限制 ChatGPT 中的网页浏览和外部服务访问,以减少提示注入攻击导致的数据泄露风险。该功能正在向符合条件的个人和企业账户推出。

持续强化ChatGPT Atlas抵御提示注入攻击

OpenAI Blog

OpenAI宣布通过对抗训练和强化防护措施,持续加固ChatGPT Atlas以抵御提示注入攻击,包括建立快速响应循环,在新型攻击策略出现于实际环境前即发现并缓解。