关于NTIA人工智能问责政策的评论
摘要
OpenAI向NTIA提交正式意见,阐述其基础模型负责任开发的方法,并支持在人工智能生态系统中建立水平和垂直问责框架。
暂无内容
查看缓存全文
缓存时间:
2026/04/20 14:54
# 对NTIA AI问责政策的评论
来源:https://openai.com/global-affairs/comment-on-ntia-ai-accountability-policy/
OpenAI很高兴能够回应美国国家电信和信息管理局(NTIA)在2023年4月13日发布的关于AI问责政策的意见征询(RFC)。
在本评论中,我们阐述了对AI问责的看法,这些看法基于我们目前为提供的服务应用的安全实践,以及我们计划为未来可能提供的服务应用的实践。我们欢迎NTIA决定将这一讨论框架化为AI问责的"生态系统"。正如RFC所指出的,政策利益相关者正在探索"一系列值得信赖的AI系统目标和部署环境"。[1](https://openai.com/global-affairs/comment-on-ntia-ai-accountability-policy/#citation-bottom-1) 为实现问责而设计的政策和实践将相应地有所不同。与此同时,具体的问责措施需要相互共存,最重要的是它们产生的综合影响。
我们认为,成熟的AI问责生态系统将包括横向和纵向两个要素。也就是说,我们既期望某些要素适用于跨应用领域的某些AI系统,也期望某些要素针对特定领域进行定制。我们从事高度能力的基础模型的开发和部署——这些模型从大量数据中学习,以便能够执行广泛的下游任务。在我们看来,像我们这样的AI开发者必须负责任地行动,并对最先进功能的开发和部署采取谨慎且以安全为中心的方法。无论这些模型可能被使用的特定领域如何,这都是成立的。
广泛的现有法律已经适用于AI——包括我们的产品——法律环境正在迅速演变,国会有立法倡议,欧洲正在开发《AI法案》,世界各地也在推进立法和政策倡议。与此同时,医学、教育和就业等领域历来的法律、监管和其他期望已经得到解释和调整,这将塑定AI在这些领域中的角色。我们将这些由深厚领域专业知识支撑的特定行业的努力,视为AI问责格局的关键部分。
我们强烈支持协调AI问责期望的努力,包括NIST AI风险管理框架、美欧贸易和技术委员会以及一系列其他全球倡议的努力。在这些努力继续推进的同时,甚至在新法律完全实施之前,我们认为自己和其他公司有责任在部署前测试、内容出处和信任与安全等问题上做出自愿承诺。
我们目前的工程方法需要独特规模的计算资源,我们将其视为定义适用于我们这样的参与者的额外且独特问责期望的有前景的基础。我们支持谨慎地限制对高度能力基础模型的任何新监管范围,以保护所有参与者的公平竞争和创新能力。
问责在整个技术生命周期中发挥作用。我们让模型安全可靠的努力始于开发前,贯穿于我们模型的部署和运营,并涉及高度能力基础模型的创建者和使用者。我们为开发者提供世界领先的能力来支持他们的应用,并为每天使用ChatGPT和我们其他服务的数百万人提供强大功能。我们的使用政策适用于我们所有模型、工具和服务的所有用户。[2](https://openai.com/global-affairs/comment-on-ntia-ai-accountability-policy/#citation-bottom-2) 我们遵守现有法律,并要求我们的开发者和用户在使用我们的服务时遵守法律。
本评论的其余部分重点关注我们目前的AI问责方法,并描述我们和其他人正在致力于加强生态系统的重要领域。我们注意到,美国和世界各地的政策制定者正在考虑广泛的政策和措施来实现AI问责,包括立法、监管、国际协议、自我监管计划以及可执行的技术和其他标准。我们感谢这些努力,并准备与其他利益相关者合作,开发和实施有效的AI问责方法。
红队测试是一个定性测试我们的模型和系统的过程,涵盖各种领域,以创建我们模型安全概况的更全面视图。我们在模型开发过程中与自己的员工进行内部红队测试,也与独立于构建被测试系统的团队运作的人员进行测试。除了探测我们组织的能力和对攻击的抵御能力外,红队还使用压力测试和边界测试方法,这些方法重点关注表面边界情况和其他可能导致伤害的潜在故障模式。
红队测试补充了我们也进行的对模型能力和风险的自动化定量评估,我们在下一部分中描述这些评估。它可以揭示尚不可量化的风险,或那些尚未开发出更多标准化评估的风险。我们之前关于红队测试的工作在DALL-E 2系统卡和GPT-4系统卡中进行了描述。
我们的红队测试通常在新模型或系统的开发阶段进行。与我们自己的内部测试分开,我们在OpenAI外部招募测试人员,并向他们提供对正在开发的系统的早期访问。OpenAI根据感兴趣领域中的先前工作(研究或实践专业知识)选择测试人员,通常包括学术研究人员和行业专业人士的组合(例如在信任与安全领域有工作经验的人)。我们评估和验证这些测试的结果,并在适当的地方采取措施进行调整和部署缓解措施。
OpenAI继续采取措施来改进持续和未来评估的外部测试人员的质量、多样性和体验。
除了上述定性红队测试外,我们还为各种能力和以安全为导向的风险创建了自动化定量评估,包括我们通过红队测试等方法发现的风险。这些评估使我们能够比较彼此的不同模型版本、迭代改进安全的研究方法,并最终作为关于我们选择部署哪些模型版本决策的输入。现有评估涵盖色情内容、仇恨内容和与自伤相关的内容等主题,并衡量模型生成此类内容的倾向。
由第三方进行的模型和系统的独立评估,随着模型能力的不断增加,可能变得越来越有价值。这样的评估可以加强对AI系统行为和风险的问责和透明度。
某些形式的评估可以在单个组织内发生,例如当一个团队评估自己的工作时,或当一个团队或组织的一部分生成一个模型,而另一个团队或部分独立行动来测试该模型时。另一种方法是由外部第三方进行评估。如上所述,我们目前依赖于我们模型的内部和外部评估的混合。
第三方评估可能关注特定部署、某个时刻的模型或系统、组织治理和风险管理实践、模型或系统的特定应用,或这些的某种组合。此类评估中使用的思考和潜在框架正在迅速演变,我们正在监测和考虑我们自己的评估方法。
对于任何第三方评估,选择具有适当专业知识和激励结构的审计员/评估员的过程将受益于进一步的明确性。此外,选择适当的期望来评估组织或模型是一个开放式探索领域,需要来自不同利益相关者的意见。最后,重要的是评估考虑系统如何随时间演变,并将其融入评估/审计流程中。
相似文章
OpenAI Blog
OpenAI 向 NTIA 提交了一份评论,概述了他们在模型权重分布方面的历史方法,从 GPT-2 的分阶段发布到 GPT-3 的 API 优先策略,同时讨论了开源模型发布与通过商业产品进行受控部署之间的权衡。
OpenAI Blog
# 对NIST人工智能行政令的回应 来源: [https://openai.com/global-affairs/response-to-nist-executive-order-on-ai/](https://openai.com/global-affairs/response-to-nist-executive-order-on-ai/) OpenAI美国国家标准与技术研究院(NIST)就《人工智能行政令》第4.1、4.5和11条款所涉任务相关信息的征询。OpenAI于2015年作为非营利组织创立,旨在确保通用人工智能——
OpenAI Blog
OpenAI 向 NTIA 提交意见,主张增加美国数据中心投资对维持美国 AI 领先地位至关重要,指出每个 5GW 设施可能为州 GDP 带来 170-200 亿美元的经济效益,并创造 4 万个就业机会。
OpenAI Blog
Sam Altman 在回应参议院关于 AI 监管的提问时,主张平衡的立法、自愿安全承诺以及对高度能力基础模型的注册/许可证要求。OpenAI 详细说明了其安全评估方法和系统卡(System Card)方法论,用于评估 GPT-4 等模型中的危险能力。
OpenAI Blog
OpenAI阐述了其在AI政策与政治倡导方面的立场,声明没有超级政治行动委员会(super PAC)捐款或员工资助的PAC,并强调在塑造AI治理过程中的透明度和公共问责。