白宫要求Anthropic阻止所有越狱行为。这可能不现实
摘要
特朗普政府要求Anthropic阻止其先进AI模型Claude Fable 5的越狱行为,但专家认为从技术上阻止所有越狱可能不可能。
特朗普政府官员告诉WIRED,如果Anthropic想要重新发布Fable 5,它需要确保模型的护栏无法被绕过。安全专家表示这不可能做到。
查看缓存全文
缓存时间: 2026/06/17 17:37
# 白宫要求Anthropic封堵所有越狱手段,这恐怕不太可能
来源:https://www.wired.com/story/the-white-house-wants-anthropic-to-block-all-jailbreaks-that-may-not-be-possible/
特朗普政府与Anthropic(https://www.wired.com/story/anthropic-is-still-at-odds-with-the-white-house-over-claude-fable-5/)就其最先进的AI模型之间的分歧,似乎正迅速走向摊牌。
特朗普官员告诉内环路(Inner Loop),如果Anthropic想重新发布Claude Fable 5——这个因越狱担忧(即通过提示词绕过模型安全护栏的方法)而于上周被出口管制措施下线的AI模型(https://www.wired.com/story/anthropic-says-us-government-ordered-it-to-shut-down-mythos-models/)——该公司需要采取实际措施来应对政府所指称的漏洞。
Anthropic连日来一直表示(https://www.anthropic.com/news/fable-mythos-access),政府的担忧被夸大了,越狱影响微乎其微。该公司在周一的商务部与白宫国家网络总监肖恩·凯恩克罗斯(Sean Cairncross)的技术会议上重申了这一立场。
但官员们表示,他们已经过了争论越狱是否严重的阶段,因为国家安全局(NSA)已得出结论,存在多种方法可以禁用Fable 5上的安全护栏——这些护栏旨在防止用户访问Mythos模型在网络安全、化学和生物学方面的能力。
据三位知情人士透露,在现阶段,政府基本上将此视为Anthropic需要自行解决的问题。
这些人士称,商务部的AI标准与创新中心以及国家安全局既没有人力也没有精力去为每一款上市模型追查每一种可能的越狱手段。
因此,政府认为Anthropic应更加主动地持续测试——不仅是Fable 5,而是其所有前沿AI模型——以发现潜在的越狱手段,并自行向政府报告。
但在更根本的层面上,目前尚不清楚Anthropic究竟该如何防止越狱。
独立网络安全专家越来越多地认为(https://www.wired.com/story/dangerous-ai-models-are-coming-no-matter-what/),AI模型上的安全护栏只是权宜之计,因为技术娴熟的用户和未来的AI模型总会找到绕过限制的方法——这意味着白宫想要实现的,恐怕是做不到的。
白宫发言人拒绝置评。
## **DNI = Don't Not Invite(别不邀请)**
本周初,特朗普选定的代理国家情报总监比尔·普尔特(Bill Pulte)原本甚至根本没有机会上任。现在,特朗普给了他一根救命稻草——而身为正式DNI提名人的杰伊·克莱顿(Jay Clayton),如今却面临可能永远无法担任该职务的前景。
先来回顾一下:特朗普最初任命其住房金融主管普尔特,接替即将卸任的DNI图尔西·加巴德(Tulsi Gabbard)。
由于普尔特缺乏法律要求的国家安全经验,并且他曾向特朗普的政治敌人提出了据称可疑的(https://www.cnn.com/2025/12/04/business/government-accountability-office-investigation-bill-pulte-mortgage-referrals)抵押贷款欺诈指控,因此遭到两党强烈反对。特朗普随后宣布任命纽约南区联邦检察官克莱顿为正式DNI提名人。
加巴德原定于6月18日离职,普尔特的首个工作日定在6月19日。但参议院共和党人质疑,如果克莱顿的听证会能加速至6月17日举行,并于6月22日上任,那普尔特还能否进入大楼?
周三,特朗普打破了这一计划。作为与参议院共和党领导层就阻挠议事规则展开的更广泛争斗的一部分,特朗普宣布无限期推迟克莱顿的听证会,显然是为了防止普尔特被挤掉。参议院共和党人随后宣布(https://x.com/SenTomCotton/status/2067244267307716622),除非克莱顿不出席或提名被撤回,否则听证会将照常进行。
知情人士称,这种情况可能对国家情报总监办公室(ODNI)造成重创——特朗普已指示普尔特大幅裁撤该机构。而员工们对普尔特的表现颇不以为然,认为他几乎没有花精力去了解这个机构,也缺乏定期的简报会。
他们还内部吐槽称,普尔特似乎急于享受DNI的待遇——该职务配有安保人员,且经常能乘坐政府专机——却不愿从事那些常常吃力不讨好的工作,比如提供冷静的情报简报和统管国家情报机构。
白宫发言人拒绝置评,并让内环路(Inner Loop)参阅特朗普在真相社交(Truth Social)上的公告(https://truthsocial.com/@realDonaldTrump/posts/116764370070279119)。
## **UFC的影响力**
上周,内环路(Inner Loop)报道了白宫助手们预计会有一批捐赠者和企业高管出席周末的UFC自由250(UFC Freedom 250),试图借此接近特朗普及政府高级官员。
这些捐赠者和高管果然如约而至,无论是在比赛当晚还是在场边举办的众多派对上。
引人注目的出席者包括派拉蒙(Paramount)首席执行官大卫·埃里森(David Ellison),他上周获得了司法部反垄断部门的批准,以收购华纳兄弟探索公司(Warner Bros Discovery)。同样在场的还有Meta首席执行官马克·扎克伯格(Mark Zuckerberg),有人一度看到他正与特朗普交谈。
周末早些时候,Meta在俯瞰白宫的Ned's Club举办了一场私人派对,出席者包括多位特朗普政府官员:代理司法部长托德·布兰奇(Todd Blanche)、白宫副幕僚长詹姆斯·布莱尔(James Blair)、白宫新闻秘书卡罗琳·莱维特(Karoline Leavitt)以及内政部长道格·伯格姆(Doug Burgum)。
此外还有几位特朗普家族成员——贾里德·库什纳(Jared Kushner)和伊万卡·特朗普(Ivanka Trump),以及凯·特朗普(Kai Trump)——他们与其他宾客交流,包括前克林顿策略师阿德里安娜·埃罗德(Adrienne Elrod)、Axios联合创始人迈克·艾伦(Mike Allen)和吉姆·范德海(Jim VandeHei)、福克斯新闻主播香农·布里姆(Shannon Bream)、华盛顿AI网络创始人塔米·哈达德(Tammy Haddad)以及前特朗普策略师凯莉安妮·康威(Kellyanne Conway)。
---
*本文选自**Hugo Lowell's** (https://www.wired.com/author/hugo-lowell/)**Inner Loop newsletter** (https://www.wired.com/newsletter?sourceCode=editarticle)。阅读往期newsletter请点击**此处。** (https://www.wired.com/tag/inner-loop/)*
相似文章
美国政府封禁Anthropic模型与AI越狱无关
美国政府发布出口管制指令,以国家安全为由强制Anthropic将其Fable 5和Mythos 5 AI模型下线。安全研究人员认为,所谓的护栏绕过并不足以证明此类行动的合理性,且此举损害了美国的网络防御能力。
Anthropic 仍与白宫就 Claude Fable 5 存在分歧
Anthropic 与特朗普政府就其 Claude Fable 5 模型的出口管制存在争议,此前白宫因越狱担忧而施加限制,该担忧源于亚马逊首席执行官安迪·贾西向财政部长斯科特·贝森特提出的问题。Anthropic 与政府官员的谈判已结束,未解除管制,商务部表示若 Anthropic 完全解决漏洞则愿意进行谈判。
Amazon安全研究据报导致白宫对Anthropic Fable的禁令
Amazon的网络安全研究导致白宫发布指令,禁止外国公民使用Anthropic的Fable 5和Mythos 5模型,引发了对这些发现是否构成越狱的争论。
对于那些抨击Anthropic的人,请阅读本文以了解当前情况
在发现一次针对性的越狱攻击后,美国政府迫使Anthropic下架其Claude Fable和Mythos模型,引发了关于AI监管和先例的严峻担忧。
白宫拒绝解除对Anthropic Fable 5的出口禁令,此前NSA警告其安全护栏可被绕过
特朗普政府拒绝解除对Anthropic的Claude Fable 5模型的出口管制,此前NSA确认其安全护栏可被绕过,引发网络安全专家之间的辩论,专家们为该模型的防御性用途辩护。