为什么负责任的AI开发需要在安全问题上进行合作
摘要
OpenAI发布了一份政策研究论文,确定了四项战略来改进行业在AI安全规范方面的合作:传达风险/收益、技术协作、提高透明度和激励标准。该分析论述了竞争压力如何可能导致对安全性的投资不足,并提出了协调激励措施以促进安全AI开发的机制。
我们撰写了一份政策研究论文,确定了四项战略,可用于提高行业在AI安全规范方面的长期合作可能性:传达风险和收益、技术协作、提高透明度和激励标准。我们的分析表明,行业在安全方面的合作对于确保AI系统的安全性和有益性至关重要,但竞争压力可能导致集体行动问题,可能导致AI公司对安全性的投资不足。我们希望这些战略将鼓励在AI安全开发方面进行更大的合作,并为AI带来更好的全球成果。
查看缓存全文
缓存时间: 2026/04/20 14:55
# 为什么负责任的AI开发需要在安全方面进行合作
来源:https://openai.com/index/cooperation-on-safety/
我们发布了一份政策研究论文,确定了四种可以在今天使用的策略,以提高长期行业在AI安全规范方面合作的可能性:沟通风险和收益、技术合作、增加透明度和激励标准。我们的分析表明,行业在安全方面的合作将对确保AI系统安全且有益至关重要,但竞争压力可能导致集体行动问题,可能造成AI公司在安全方面投资不足。我们希望这些策略能促进更广泛的安全AI开发合作,并带来更好的全球AI成果。
如果安全开发带来的相互收益更高,公司就有更强的动力在安全方面进行合作。通过强调尽早建立良好安全规范的好处,如防止AI故障和滥用事件,以及建立基于对新兴AI系统共同理解的安全标准,可以改善合作前景。类似于Risk Salon(https://risksalon.org/)这样的协作努力就是很好的例子,该组织为从事欺诈、风险和合规工作的人员举办活动。这些活动便于来自不同公司的参与者进行开放讨论,似乎主要由改进风险缓解策略的共同利益所驱动。
减少公司通过不在安全方面合作而期望获得的优势应该会增加整体安全标准的遵守。例如,生产USB连接器的公司不会期望通过偏离USB连接器标准而获得很大收益,因为这样做会使其产品与大多数设备不兼容。当标准已经建立且偏离标准的成本大于任何收益时,优势就很低。在AI环境中,降低实施安全预防措施的成本和难度将有助于最小化忽视这些措施的诱惑。此外,政府可以营造一个监管环境,其中违反高风险安全标准是被禁止的。
我们找到了四种可以在今天使用的策略,以提高行业在AI安全规范和标准方面合作的可能性。这些是:
**1. 推进关于合作机会的准确认知**
沟通与AI相关的安全和安保风险,表明可以采取具体措施促进安全方面的合作,并使共同的安全顾虑成为公共知识。
**2. 在共同的研究和工程挑战上进行合作**
开展联合跨学科研究,促进安全并有利于培养强大的合作(例如涉及结合互补专业知识领域的工作)。
**3. 向适当的监督和反馈开放AI开发的更多方面**
公布行为守则,提高关于出版决策的透明度,并在安全和知识产权顾虑得到解决的前提下,向更广泛的审查开放个别AI系统。
**4. 激励坚持高安全标准**
表扬坚持安全标准的行为,指责未能确保系统安全开发的行为,并支持经济、法律或行业范围内的激励措施以坚持安全标准。
我们认为,随着AI系统变得越来越强大,集体行动问题可能是政策挑战的主要来源。本分析侧重于行业在防止此类问题中可以发挥的作用,但我们预期法律和政治机制也将在防止和缓解这些问题中发挥重要作用。我们还预期,找到类似的机制以改善国家之间以及与其他非行业行为体之间的AI安全合作将在未来几年中变得越来越重要。关于未来AI系统可能带来的挑战存在很大不确定性,但我们相信鼓励更广泛的安全AI开发合作可能会对AI开发的成果产生积极影响。
虽然我们承认这些挑战的存在,但我们主张更全面地绘制跨组织和国家边界的可能合作,特别关注其解决方案可能具有广泛实用性的研究和工程挑战。需要考虑的领域可能包括AI系统能力形式验证及AI安全和安保其他方面的联合研究,其应用范围广泛;各种应用型"AI向善"项目,其结果可能具有广泛的、基本上是正面的应用(例如在可持续性和健康领域);以及针对全球AI相关威胁(如网上合成媒体生成的滥用)的对策的联合开发。为了在安全方面实现更大的合作,我们需要使人们普遍认识到这种合作符合每个人的利益,以及实现它的方法可以在今天被确定、研究和实施。
相似文章
OpenAI 安全实践
OpenAI 介绍了其积极采用并不断改进的 10 项安全实践,包括实证红队测试、对齐研究、滥用监控以及在首尔 AI 峰会上分享的自愿承诺。该公司强调采用均衡、科学的安全方法,将其融入开发的各个环节。
我们的AI安全方法论
OpenAI阐述了其全面的AI安全方法,强调严格测试、迭代部署、现实世界监控和监管合作,以确保强大的AI系统得到安全构建和使用。
AI安全需要社会科学家
OpenAI主张AI安全研究中的价值对齐需要社会科学家的帮助,以解决人类认知偏差和不一致如何影响用于训练AI系统的数据的问题。该组织提议通过仅涉及人类的实验方法来发现对齐问题,然后再部署机器学习解决方案。
具体的AI安全问题
OpenAI、伯克利和斯坦福的研究人员共同撰写了一篇基础性论文,指出了现代AI系统中的五个具体安全问题:安全探索、对分布偏移的鲁棒性、避免负面副作用、防止奖励黑客和可扩展的监督。
推进AI治理发展
OpenAI发布AI治理建议,承诺企业进行内部和外部红队测试以应对安全风险,共享有关新兴能力的信息,以及建立检测AI生成音频和视觉内容的机制。