记录中的问题

OpenAI Blog 2023/06/22 00:00 新闻

摘要

Sam Altman 在回应参议院关于 AI 监管的提问时，主张平衡的立法、自愿安全承诺以及对高度能力基础模型的注册/许可证要求。OpenAI 详细说明了其安全评估方法和系统卡（System Card）方法论，用于评估 GPT-4 等模型中的危险能力。

以下是 Sam Altman 在美国参议院司法委员会（隐私、技术与法律小组委员会）作证后的记录中的问题。

查看原文

查看缓存全文

缓存时间: 2026/04/20 14:51

# 议会质询记录来源：https://openai.com/global-affairs/sam-altman-senate-questions-for-the-record/ #### 回应肯尼迪议员 *1. 国会在制定人工智能监管立法时应该考虑的最重要因素是什么？* 任何与人工智能相关的新法律都将成为复杂法律和政策框架的一部分。现有的各种法律已经适用于人工智能，包括我们的产品。在医学、教育和就业等领域，政策利益相关者已经开始调整现有法律以适应人工智能的影响。我们期待为开发一种平衡的方法做出贡献，既能解决人工智能带来的风险，同时也能让美国人民和世界各地的人受益于这一技术。我们强烈支持为人工智能制定统一的问责期望，包括NIST人工智能风险管理框架、美国-欧盟贸易和技术委员会以及一系列其他全球倡议的努力。在这些努力继续推进的同时，甚至在新法律完全实施之前，我们认为我们和其他公司有责任在部署前测试、内容来源追溯和信任安全等问题上做出自愿承诺。我们已经在负责任和安全的模型开发和部署方法上进行了大量工作，包括通过红队测试和潜在危险模型能力及风险的定量评估。我们主要通过一份我们目前称为系统卡（System Card）的公开文件报告这些工作。我们正在与更广泛的公共政策讨论相结合地改进这些方法。对于未来一代最具能力的基础模型（这些模型可能比以前被证明安全的模型更强大），我们支持制定注册、披露和许可要求。这种披露可以帮助政策制定者获得必要的可见性，以设计有效的监管解决方案，并领先人工智能前沿进展的趋势。为了有益而不会带来新风险，任何此类制度必须优先保护所披露信息的安全性。许可在航空旅行、电力生成、药物制造和银行业等安全关键和其他高风险领域很常见。许可证持有人可能需要执行部署前风险评估并采用最先进的安全和部署保护措施。在设计人工智能前沿开发问责的注册和许可机制方面仍然存在许多未决问题，如如何精确定义此类模型，以及如何确保较小的公司不会被不必要的监管过度负担。我们期待与政策制定者合作解决这些问题。 *2. 你能提供一份你在测试模型时使用的危险能力评估列表吗？* 当我们发布GPT-4时，我们发布了一份我们称为系统卡的文件，该文件描述了我们评估GPT-4中危险能力潜力的方法，举出了我们调查的具体能力示例，描述了我们的发现，并解释了我们为解决已确定风险所采取的措施。我随附GPT-4系统卡的副本供参议院记录。你将在系统卡第4页找到安全挑战的简明列表，在第4-20页找到我们评估的详细信息，在第21-25页找到已实施的缓解措施的详细信息。安全最佳实践的开发，包括危险能力的标准化评估，是OpenAI以及Anthropic、Google Deepmind和Microsoft等其他前沿实验室的积极关注点。我们预计这些技术努力将与公共政策工作相结合，以定义有意义和有效的衡量危险能力和降低风险的标准。 *3. 你能提供一份模型在部署到世界之前必须通过的具体测试列表吗？* 我们不断完善决定部署哪些模型的流程。下面的描述是我们当前方法的快照。我们打算在未来更公开地分享我们的方法，并随时很乐意与你或你的工作人员进行进一步讨论。我们对模型的能力和安全维度使用广泛的评估。这些不仅包括定量评估，还包括质性评估，如红队测试和与具体风险领域外部专家的合作。根据特定模型的新颖性和能力水平，我们应用不同的评估流程。例如，任何全新模型都将经历广泛的测试；对现有模型的小调整需接受这些测试的子集。我们目前对部署决策进行两种不同类型的审查。一些模型由安全委员会进行更加深化和专业的审查，该委员会执行（或指示员工执行）进一步的技术和社会影响分析。这些通常是可能具有比我们以前部署的模型有显著更大和更新颖能力的模型，通常是由于在训练中采用的计算资源或技术参数明显优越。技术特性与已部署模型相当的模型不通过此审查委员会，尽管它们可能仍会受到如下所述和附件系统卡中描述的一系列评估。 OpenAI有时会为特定定量指标上充分安全的性能设置具体目标，如拒绝特定风险类别中一定百分比的输出，或在不同类型输入中实现足够的性能一致性。其他时候，我们使用更全面和质性的标准，如我们通过红队测试、专家合作等获得的风险理解已经"趋同"到我们相信充分安全的合理稳定点的程度，以及我们的缓解措施足以解决已确定风险的程度。随着时间的推移，与我们的迭代部署方法一致，早期访问（如研究人员访问、红队测试、alpha测试）和更大规模访问的经验教训被反馈到改进这些相同已部署模型的缓解措施中，以及改进未来模型部署流程的制度学习中。 #### 回应蒂利斯议员 *1. 你认为生成式人工智能对受版权保护作品创作者的主要威胁是什么？你计划如何解决这些威胁？* 我们与许多创意工作者进行过交流，他们对人工智能的机遇和潜在风险持有广泛的意见。许多创意工作者对人工智能为简化和优化其工作以及赋予他们新能力所带来的机遇感到兴奋。人工智能系统可以帮助创建初稿以供审议、帮助进行书面作品的初步研究，或允许创意工作者快速迭代想法和草图。例如，DALL-E 2通过迭代的人驱动流程帮助一组设计师和艺术家为Cosmopolitan Magazine的一期杂志创建新封面。(https://openai.com/global-affairs/sam-altman-senate-questions-for-the-record/#citation-bottom-1) 我们也意识到许多创意工作者担心被人工智能取代。我们与著名的艺术家、音乐家、作家、演员、电影制作人和其他群体讨论过这些问题。创意工作者担心开发不当的人工智能系统可能会直接复制或创建其作品的衍生物。许多创意工作者也想知道在人工智能能够以远高于人类速度和规模"创建"东西的世界中做一个人类创意工作者意味着什么。一些创意工作者还担心人工智能系统创造的价值将流向大型公司（如科技平台或行业权利组织），减少个人创意的价值和力量。其他创意工作者对这些担忧提出了显著的对立观点。他们指出，人类创意工作者的角色是能够看到并赋予生命他人无法看到的东西，而人工智能将不会替代这种人类火花，人工智能也将无法"看到"首先这样的东西。他们还观察到，人工智能只是长期以来协助和赋予创意工作者权力的众多技术工具中的最新一个；最新一代的创意工作者已经在这些工具上大展身手，这些工具将迅速变得无处不在，并成为创意工作流程的必要条件，正如许多技术工具（如CGI或自动调音）现在一样。 OpenAI不想替代创意工作者。我们希望我们的系统被用于赋予创意工作者权力，支持和增强艺术家和创意工作者的根本人性。我们设计并继续完善我们的系统以支持这些目标。我们继续与各种创意工作者和创意团体就这些问题进行合作，并致力于参与这些主题的行业和政策讨论，并根据反馈更新我们的方法和思维。 *2. 为了确定训练数据和模型中受版权保护作品的存在，OpenAI在多大程度上保留了关于ChatGPT和Jukebox各个版本摄入内容的记录？* ChatGPT的训练数据基于可公开访问的内容、许可内容和来自人类训练者的数据。OpenAI保留与这些开发活动相关的记录，并且之前已披露可公开访问内容的绝大多数来自Common Crawl和Wikipedia等公开来源。 Jukebox的训练数据在2020年Jukebox发布时发布的一份论文中进行了讨论。(https://openai.com/global-affairs/sam-altman-senate-questions-for-the-record/#citation-bottom-2) 该模型是一个非商业研究项目，旨在推进科学进步和对音乐的理解，附加到该项目的许可证进一步规定它只能用于非商业目的。开源许可证可在此项目的Github存储库中查看。(https://openai.com/global-affairs/sam-altman-senate-questions-for-the-record/#citation-bottom-3) OpenAI在Jukebox发布时与一个领先的音乐行业组织进行了对话，自发布以来没有对该模型进行任何重大工作。虽然在生成式人工智能音乐中可能有许多有趣的商业应用可以同时尊重创意工作者的工作并推进艺术和科学，但这不是OpenAI当前活动的关注领域。 *3. 展望未来，是否有计划让创意工作者能够控制其作品是否被纳入训练数据以及其作品如何被特定模型使用？现有的训练数据和模型中那些未经任何创意工作者控制就被使用过的作品又该如何处理？* 如上所述和在众多公开声明中，OpenAI致力于与创意工作者互动并尊重创意过程。OpenAI的训练数据来自多种来源，包括Common Crawl等可公开获得的资源，以及通过许可内容所有者的内容。启用控制的一种方法是为创意工作者提供选择不让其作品用于帮助教导人工智能模型的途径。虽然我们不相信作为公共政策的问题，任何人学习作品的能力应受到限制，但我们理解创意工作者对其作品被用于帮助教导人工智能模型的关切以及对被取代或替代的恐惧。我们继续与创意工作者进行建设性和富有成果的讨论，以互利和可接受的方式使用他们的内容。Common Crawl等资源尊重内容所有者禁止在该资源中使用其内容的行业标准方式，因此许多内容所有者已经能够限制其作品被用于教导人工智能模型。我们也在这个领域开展许多其他想法的工作。我们继续与各种创意工作者和创意团体就这些问题进行合作，并致力于参与这些主题的行业和公共政策讨论，以及根据反馈更新我们的方法和思维。 #### 回应德宾议员 *1. 二月，司法委员会就儿童在线安全举行了听证会。在该听证会期间，证人Emma Lembke作证证实社交媒体对她成长过程的影响。她解释说："随着我的屏幕时间的稳步增加，我的身心健康都受到了影响。"* 这是当今许多孩子分享的一种经历。从2015年到2021年，孩子们每天在社交媒体上花费的时间增加到近三个小时——六年增长近60%。在类似的时间段，CDC数据显示了我们孩子负面心理健康结果的大幅上升——特别是十几岁的女孩。到2021年，42%的青少年报告了持续的悲伤或绝望感，近三分之一的十几岁女孩表示他们曾认真考虑自杀。我担心人工智能可能会加剧这一问题。 a. 考虑到我们在社交媒体方面的经验，是否有办法安全地部署人工智能，使其不会使我们的孩子目前正经历的心理健康危机变得更糟？ b. 如果有的话，什么样的具体保护措施是必要的，以最大限度地减少人工智能可能对孩子造成的潜在伤害？我们与广泛的利益方共同关注保护儿童免受负面经历，并使他们在新技术中有积极体验的利益。我们不销售广告、建立用户档案或试图最大化人们与我们产品互动的时间。在许多情况下，我们最好的体验涉及人们只花很短时间与ChatGPT互动，因为它快速高效地完成了他人的要求。我们的重点是使我们的服务有用，而不是成瘾性的。我们采用中立的年龄筛选机制来禁止13岁以下的用户，我们的法律条款要求13-18岁的用户获得父母同意。我们也在评估其他年龄筛选技术的改进。如果我们发现13岁以下的儿童直接向OpenAI提供了个人信息，我们会删除该数据，不会将其用于任何目的。如果我们确定账户是由13岁以下的儿童创建的，我们会关闭该账户。我们培训我们的系统拒绝生成仇恨、骚扰、暴力、自杀、自伤或成人内容。我们的信任和安全工作还涉及自动化和人工审查流程，以监控滥用行为。如果用户尝试将已知儿童性虐待材料上传到我们的图像工具，我们使用Thorn的Safer检测、审查、阻止和向NCMEC报告该活动。我们经常听到教育工作者希望找到方法使用我们的服务来帮助他们教学。我们正在开发一个ChatGPT版本供企业和组织使用，包括教育机构，以允许他们以安全和负责任的方式与其使用者分享这项技术的好处。我们将继续与专家合作，以便可能针对年轻人的任何教育产品都是在考虑其安全和福祉的情况下开发的。 *2. 你支持哪些具体的护栏和/或法规，这些护栏和/或法规将允许社会从人工智能进步中获益，同时最大限度地减少

记录中的问题

相似文章

在美国参议院的证词

前沿AI监管：管理新兴的公共安全风险

关于NTIA人工智能问责政策的评论

@levie：我们现在有了事实上的AI监管。目前尚不清楚为什么从现在开始，具有特定能力水平的模型……

我们的AI安全方法论

提交意见反馈