OpenAI对儿童安全的承诺:采取安全设计原则
摘要
OpenAI及包括亚马逊、谷歌、Meta、微软在内的主要科技公司已承诺在生成式AI的开发、部署和维护中实施“安全设计”原则以保护儿童。该倡议旨在通过模型开发、发布及持续平台安全方面的综合措施,降低儿童性虐待材料生成和传播的风险。
暂无内容
查看缓存全文
缓存时间: 2026/04/20 14:47
# OpenAI 对儿童安全的承诺:采用安全设计原则
来源:https://openai.com/index/child-safety-adopting-sbd-principles/
OpenAI 与亚马逊、Anthropic、Civitai、Google、Meta、Metaphysic、Microsoft、Mistral AI 以及 Stability AI 等行业领导者共同承诺,在生成式 AI 技术的开发、部署和维护中实施强有力的儿童安全措施,正如《安全设计原则》所阐述的那样。这项倡议由致力于保护儿童免受性虐待的非营利组织 Thorn(在新窗口打开)(http://thorn.org/)以及致力于解决科技与社会复杂问题的组织 All Tech Is Human(在新窗口打开)(https://alltechishuman.org/)牵头,旨在降低生成式 AI 对儿童构成的风险。通过采纳全面的安全设计原则,OpenAI 及同行确保儿童安全在 AI 开发的每个阶段都得到优先考虑。迄今为止,我们已付出巨大努力,尽可能降低模型生成对儿童有害内容的可能性,为 ChatGPT 设置年龄限制,并积极与国家失踪与受虐儿童中心(NCMEC)、技术联盟以及其他政府和行业利益相关方合作,共同探讨儿童保护问题并改进报告机制。
作为这项安全设计工作的一部分,我们承诺:
1. **开发**:开发、构建并训练主动应对儿童安全风险的生成式 AI 模型。
- 负责任地获取训练数据集,检测并移除训练数据中的儿童性虐待材料(CSAM)和儿童性剥削材料(CSEM),并将任何确认的 CSAM 报告给相关当局。
- 在开发过程中纳入反馈循环和迭代压力测试策略。
- 部署解决方案以应对对抗性滥用。
2. **部署**:在生成式 AI 模型经过儿童安全评估后发布和分发,并在整个过程中提供保护。
- 打击和回应虐待性内容与行为,并纳入预防工作。
- 鼓励开发者主动承担安全设计责任。
3. **维护**:通过持续积极了解和应对儿童安全风险,维护模型和平台安全。
- 承诺从我们的平台上移除恶意行为者生成的新 AIG-CSAM。
- 投资于研究及未来技术解决方案。
- 在我们的平台上打击 CSAM、AIG-CSAM 和 CSEM。
这一承诺是防止 AI 技术被滥用于创建或传播儿童性虐待材料(AIG-CSAM)及其他形式儿童性伤害的重要一步。作为工作组成员,我们还同意每年发布进展更新。
相似文章
OpenAI 安全实践
OpenAI 介绍了其积极采用并不断改进的 10 项安全实践,包括实证红队测试、对齐研究、滥用监控以及在首尔 AI 峰会上分享的自愿承诺。该公司强调采用均衡、科学的安全方法,将其融入开发的各个环节。
打击网络儿童性剥削和虐待
OpenAI宣布推出全面的政策和技术措施,以防止其模型被用于儿童性剥削和虐待,包括部署前保护、用户监测、开发者监管以及与NCMEC和Thorn等组织的合作。
推出 Child Safety Blueprint
OpenAI 推出 Child Safety Blueprint,这是一个与 NCMEC、州检察长和 Thorn 共同制定的政策框架,旨在通过现代化法律、改进提供商报告和内置安全措施来打击 AI 助力的儿童性剥削。该倡议整合了法律、运营和技术方法,以大规模预防和检测儿童安全危害。
帮助开发者构建更安全的青少年AI体验
OpenAI发布了基于提示的安全策略和开放权重的gpt-oss-safeguard模型,帮助开发者构建适合青少年的AI体验,涵盖图形内容、有害行为和危险活动等风险。
OpenAI Japan 宣布 Japan Teen Safety Blueprint,将青少年安全放在首位
OpenAI Japan 宣布推出 Japan Teen Safety Blueprint,该框架引入了年龄感知保护、针对18岁以下用户的更强安全政策、扩展的家长控制以及以福祉为中心的设计功能,以确保青少年安全使用生成式AI。