提升 AI 开发中的可验证性

OpenAI Blog 新闻

摘要

OpenAI 发布了一份报告,介绍了提升 AI 开发可验证性的机制,说明了利益相关者如何验证组织关于 AI 系统属性和安全实践的声明。

我们与来自 30 个组织的 58 位合著者共同参与了一份多利益相关者报告,这些组织包括 Centre for the Future of Intelligence、Mila、Schwartz Reisman Institute for Technology and Society、Center for Advanced Study in the Behavioral Sciences 和 Center for Security and Emerging Technologies。该报告介绍了 10 种机制,用于提升关于 AI 系统的声明的可验证性。开发者可以使用这些工具提供证据,证明 AI 系统是安全、可靠、公平或隐私保护的。用户、政策制定者和民间社会可以使用这些工具评估 AI 开发流程。
查看原文
查看缓存全文

缓存时间: 2026/04/20 14:51

# 改进AI开发中的可验证性 来源:https://openai.com/index/improving-verifiability/ 越来越多的组织已经阐述了伦理原则来指导他们的AI开发流程,但组织外的人很难验证该组织的AI系统是否在实践中反映了这些原则。这种模糊性使用户、政策制定者和民间社会等利益相关者更难以审查AI开发者对AI系统属性的声明,并可能导致竞争中的偷工减料行为,增加社会风险和危害。该报告描述了现有的和潜在的机制,可以帮助利益相关者解决以下问题: - 我(作为用户)能否验证关于新AI系统隐私保护级别的声明,我想用它来翻译敏感文件? - 我(作为监管者)能否追踪导致自动驾驶车辆事故的步骤?应该根据什么标准来比较自动驾驶汽车公司的安全声明? - 当我缺乏行业的计算资源时,我(作为学者)能否对大规模AI系统相关的风险进行公正的研究? - 我(作为AI开发者)能否验证我在AI开发领域的竞争对手会遵循最佳实践,而不是通过偷工减料来获得优势? 报告中突出强调的10个机制列举如下,以及旨在推进每个机制的建议。(请参阅[报告](https://arxiv.org/abs/2004.07213)了解这些机制如何支持可验证的声明以及我们发现的相关注意事项。)

相似文章

为什么负责任的AI开发需要在安全问题上进行合作

OpenAI Blog

OpenAI发布了一份政策研究论文,确定了四项战略来改进行业在AI安全规范方面的合作:传达风险/收益、技术协作、提高透明度和激励标准。该分析论述了竞争压力如何可能导致对安全性的投资不足,并提出了协调激励措施以促进安全AI开发的机制。

OpenAI 安全实践

OpenAI Blog

OpenAI 介绍了其积极采用并不断改进的 10 项安全实践,包括实证红队测试、对齐研究、滥用监控以及在首尔 AI 峰会上分享的自愿承诺。该公司强调采用均衡、科学的安全方法,将其融入开发的各个环节。

我们的AI安全方法论

OpenAI Blog

OpenAI阐述了其全面的AI安全方法,强调严格测试、迭代部署、现实世界监控和监管合作,以确保强大的AI系统得到安全构建和使用。

推进AI治理发展

OpenAI Blog

OpenAI发布AI治理建议,承诺企业进行内部和外部红队测试以应对安全风险,共享有关新兴能力的信息,以及建立检测AI生成音频和视觉内容的机制。

通过外部测试强化我们的安全生态系统

OpenAI Blog

OpenAI宣布通过外部第三方测试和评估前沿AI模型来加强安全生态系统,包括独立评估、方法论审查和领域专家探测。该公司承诺通过公开分享第三方评估结果和自GPT-4推出以来支持独立评估来提高透明度。