特朗普的AI评估行政令:正确的政策,未完成的治理

Reddit r/artificial 新闻

摘要

特朗普的行政令建立了部署前AI评估的国家政策,解决了国家安全问题,但也引发了关于透明度和问责制的疑问。

特朗普总统的新行政令建立了一个自愿性质的部署前AI评估机制。这是有意义的一步。该行政令正确把握了政策问题,具备先进网络能力的前沿AI模型不应未经严格测试就推向世界。它是否留下了合法性未解决的问题?保密性、自愿参与和行业临近性是一个脆弱的组合。链接🔗[这里](https://www.forbes.com/sites/paulocarvao/2026/06/02/trumps-ai-evaluations-order-right-policy-unfinished-governance/)。
查看原文
查看缓存全文

缓存时间: 2026/06/03 13:46

# 特朗普的AI评估行政令:政策方向正确,治理尚待完善 来源:https://www.forbes.com/sites/paulocarvao/2026/06/02/trumps-ai-evaluations-order-right-policy-unfinished-governance/ 人工智能法律 一项联邦机密AI审查流程可能强化国家安全,但其合法性将取决于公众问责。 getty 特朗普总统新的[行政令](https://www.whitehouse.gov/presidential-actions/2026/06/promoting-advanced-artificial-intelligence-innovation-and-security/)确立了部署前AI评估的国家政策。这是朝着正确方向迈出的一步,也背离了其政府严格放松监管的做法。在政府与领先AI公司之间的关系已经过于密切、令人不安之时,一个机密的、自愿的流程能否赢得公众信任——这个问题行政令留给了悬而未决。 在[上月的一篇文章](https://www.forbes.com/sites/paulocarvao/2026/05/06/pre-deployment-ai-evaluation-moves-from-chinas-model-to-washington/)中,我曾写道,华盛顿正朝着部署前AI评估的方向迈进,这种做法此前见于中国的AI政策。中国将发布前控制作为国家中心治理模式的一部分。美国此前一直抵制这一路径,偏向创新、市场竞争和轻触式监管。6月2日的行政令表明,即使是华盛顿放松监管的姿态现在也有了界限。当前沿AI模型可能实质性影响网络安全、国家安全和关键基础设施时,"先发布,后应对"已不再是可接受的政策。 这份行政令范围狭窄,这一点很重要。第1条和第2条设定了目标,然后主要聚焦于政府内部能力、网络防御以及联邦系统和关键基础设施之间的协调。这些都是合法的国家优先事项。美国应该现代化其网络防御能力,帮助乡村医院、地方公用事业和社区银行强化系统,并建设更强的AI驱动防御能力。 然而,使网络政策有效的同一技术框架也可能使其具有政治敏感性。这种可能性并非理论上的。五角大楼涉及Anthropic的[供应链风险认定](https://www.forbes.com/sites/paulocarvao/2026/03/04/the-conscience-clause-anthropic-pentagon-standoff-reveals-who-governs-ai/)已经显示,关于AI公司的判断可能变得充满争议,尤其当流程不透明时。供应链风险认定、采购排除和非正式政府压力在某些情况下可能是合理甚至必要的。它们同样需要纪律、明确的标准和问责制。为保护国家安全而建立的机制可能开始看起来像是为了偏袒某些参与者、施压其他参与者,或模糊风险评估与政治裁量之间的界限。这使得治理细节至关重要。 ## AI评估与国家安全 第3条是行政令的核心。它指示财政部、战争部和国土安全部,在征求白宫幕僚长以及其他几个机构与政府官员的意见后,制定一个分类基准测试流程,以评估AI模型的高级网络能力,并判定何时一个高级AI模型强大到足以触发政府审查。随后,它创建了一个自愿路径,让公司可以在向其他可信合作伙伴发布前,最多提前30天向政府提供此类模型的使用权限。行政令未明确向公众发布的时间表。 这不是一个许可制度。行政令明确表示,它并未授权对新的AI模型实行强制性"许可、预先批准或许可证要求"。这一措辞保留了合作框架,而非为前沿AI建立行政分支的审批系统。 我支持这一基本结构。对于网络能力而言,完全公开的基准测试将适得其反。如果政府发布了关于模型能否发现或利用软件漏洞的精确测试标准,对手将从中吸取教训。实验室也会针对该基准进行训练。在AI领域,公开基准测试的半衰期很短。它们会成为目标,然后成为营销话术,最终成为昨日模型周期的怀旧物。 一套分类的基准测试可以保留出其不意的效果。它能让政府在不泄露最关键的漏洞、方法或阈值的情况下测试危险能力。它还能帮助联邦政府和前沿实验室在以下问题上达成一致:什么样的AI驱动网络能力水平在广泛部署前需要额外审查。 相比于关于AI安全的模糊演讲,这是一个实质性的进步。 ## 部署前AI评估需要信任 问题在于,在一个信任本已薄弱的政治体系中,如何为这个必然透明度较低的流程建立合法性。参与是自愿的,流程可能只涉及少数几家前沿AI公司,国家安全机构将扮演核心角色,而结果可能影响市场时机、声誉和与可信合作伙伴的接触——即便如此,关键决策仍对公众隐藏。 这种组合带来了三个风险。 第一个是缺乏正式监管的"监管俘获"。参与该流程的公司可能获得与政府官员接触的特权、对国家安全优先事项的早期洞察以及相对于竞争对手的声誉优势。即使没有人称之为"认可印章",市场也可能将其视为一个。 第二个是选择性认定。基准测试流程可能必须保密,但判定一个模型何时成为"受覆盖前沿模型"的标准应该是可见的。如果外界无法理解认定的依据,他们将难以判断同类模型是否受到同等对待。 第三个是"使命蔓延"。为前沿模型审查而创建的网络基准测试可能开始影响采购决策、出口管制、安全认定以及机构与私营企业的关系。其中一些可能是适当的。另一些则可能远超行政令的原始目的。 本届政府与科技行业部分群体之间的密切关系使情况更加复杂。自愿流程可以是合理的。但在政治盟友和经济在役者之间进行的自愿流程可能看起来像"俱乐部治理"。这不是拒绝政府与产业合作的理由。而是为其建立护栏的理由。 ## AI评估需要公众问责 政府应该围绕分类基准测试发布一个非秘密的治理框架。该框架应说明谁参与、如何处理利益冲突、哪些机构拥有决策权、公司如何被筛选、评估哪些一般类别的风险,以及当模型引发严重关切时会发生什么。 政府还应报告汇总信息。它可以披露审查模型的数量、调查结果的一般类别、整改类别,以及模型发布在测试后进行了多大程度的修改。这可以在不泄露分类方法或网络漏洞的情况下进行。 国会也应该发挥作用。行政令是不稳定的。它们会随着政府更迭、人事变动和政治激励而改变。如果部署前AI评估正成为美国AI治理的反复出现的特征,国会应提供一个两党共识的法定基础。 这份行政令在政策问题上方向正确。具有高级网络能力的前沿AI模型不应该未经严格测试就被推向世界。但它也留下了合法性问题的待解。保密性、自愿参与和产业亲近度是一个脆弱的组合。

相似文章