对于那些抨击Anthropic的人,请阅读本文以了解当前情况
摘要
在发现一次针对性的越狱攻击后,美国政府迫使Anthropic下架其Claude Fable和Mythos模型,引发了关于AI监管和先例的严峻担忧。
暂无内容
查看缓存全文
缓存时间: 2026/06/15 17:00
# 《曾经的寓言,未来的寓言》#2
来源:https://thezvi.substack.com/p/the-once-and-future-fable-2
周五晚上,**美国政府强制Anthropic移除所有对Fable和Mytho的访问权限**(https://thezvi.substack.com/p/american-government-takes-down-claude?r=67wny)。
这周末过得糟透了。
> Dean W. Ball(https://x.com/deanwball/status/2066280038085865629):关于AI监管被随意强加于刚发布的高性能模型这件事,在某种意义上说,政府实实在在让我的世界变得*更蠢了*。虽然我对政府总有种印象上的感觉,但这次是字面意义上的。
更多细节浮出水面。目前仍存在一些信息迷雾,但我们现在相当清楚,Claude Fable和Mythos为何被(愚蠢至极地)下架了。
1. 发现了一个狭义的越狱手段,Anthropic事先警告过这种类型显然存在。所有展示的输出都是GPT-5.5不仅能生成、而且无需任何越狱或绕过就能生成的内容。
2. 白宫要求Anthropic下架Fable以“修复”情况,当Dario试图解释根本没有需要修复的情况时,对方充耳不闻。
3. 当Anthropic没有照做时,白宫对他们施加了出口限制——他们明知这会让所有人都无法访问Fable和Mythos。
许多虚无主义者正在为这一决定辩护,并责怪Anthropic,这些人恰恰证实了**Dean Ball对美国政府的描述:一个垂死的NPC临终病人,我们必须恰当安抚**(https://www.hyperdimensional.co/p/clawed),用“正确的氛围和卑躬屈膝”来防止他们突然攻击我们。只不过他们把这种行径等同于力量和正义,因为强权即真理,权力和氛围。
这是一个快速发展的故事,时效性溢价很高,因此我对任何错误以及结构可能不理想表示歉意。我们会尽力而为。
我们不知道的是:
1. 政府做出这些决定的动机是什么。
2. 他们对这一切运作方式的理解有多深。
3. 他们要求的是狭义的修复还是全局修复。1. 狭义修复可能很容易。全局修复可能不可能。
4. 他们接下来打算做什么,以及他们想要达到什么目的。
好的结果是,这是一个可怕的误解,反映了恐慌反应,可以迅速解决,之后我们可以恢复访问权限。或者他们面临足够大的压力,迅速意识到自己犯了错误,或者Anthropic可以做些什么来快速安抚他们的担忧,即使这很愚蠢。但依然会留下一个可怕的先例,给美国AI的信任、我们的商业环境、我们雇佣重要外国AI人才的能力、美国与盟友的关系、玻璃之翼计划和网络安全的进展,以及法治带来永久性损害。
一线希望(或许很大)是,这证明了当我们真正需要行动时,**我们并不害怕行动**(https://x.com/TomDavidsonX/status/2066273525246443629),即使付出巨大的经济和政治代价。有时会出现国家安全或其他问题驱动的需求,如果你无法在不关停的情况下满足该需求?那就没办法了。这次(除了极其罕见的例外)是一次远远超出安全倡导者敢提议作为选项的行为,而且它发生了。所以,在这种情况下一句“放弃吧,政府永远不会做[X]”的说法就不再成立了。
这也强调了,需要在我们实际需要行动之前,现在就想好如何妥善行动。如果我们陷入这种情况,又没有好的方法来做[X],那么我们很可能会用一种糟糕、随意、极具破坏性的方式来做[X]。所以,赶紧想办法达成协议、暂停、下架某个模型等等。
坏的结果是,这不是一个可怕的误解,而是由其他因素驱动,且无法迅速解决。政府可能正迅速升级,试图让一个想要成为威权单一行政机构的人强行接管美国领先的AI实验室——这个机构认为你永远不该反驳它,当它说要跳(或要求股票,或任何其他东西)时,所有人都应该问跳多高。否则。
还有第三种可能性,尽管现在看起来不太可能:白宫是正确的,威胁是真实的,这是一场紧急情况——不管他们当时有没有向Dario和Anthropic很好地解释这一点,也不管他们现在有没有很好地解释。也许这件事本身就很危险,或者它意味着其他危险的风险太高了。
在我们可以核实技术主张之前,**我们不能排除这种可能**(https://x.com/JeffLadish/status/2066336272420135047)。我们也不应假设下一次公司是对的、政府是错的。很有可能,有一天一家公司会说“一切安好”,但却大错特错。
如果事实证明这是真的,Anthropic将在各方面失去大量信誉,这也是我为什么认为这如此不可能的原因。他们在这里可冒不起犯错的风险。
1. 发生了什么:底线。(https://thezvi.substack.com/i/202117817/what-happened-when-the-bottom-line)
2. 亚马逊致电白宫。(https://thezvi.substack.com/i/202117817/amazon-calls-the-white-house)
3. 政府恐慌。(https://thezvi.substack.com/i/202117817/the-government-panics)
4. 更愚蠢的版本。(https://thezvi.substack.com/i/202117817/the-stupider-version)
5. 根本没有健康静修。(https://thezvi.substack.com/i/202117817/there-was-no-wellness-retreat)
6. 把你的威胁说清楚。(https://thezvi.substack.com/i/202117817/make-your-threats-explicit)
7. 中国在访问Mythos吗?(https://thezvi.substack.com/i/202117817/was-china-accessing-mythos)
8. Anthropic在被要求时是否仍应下线Fable?(https://thezvi.substack.com/i/202117817/should-anthropic-still-have-taken-fable-offline-when-asked)
9. 是的,这是针对Fable的下架命令。(https://thezvi.substack.com/i/202117817/yes-this-was-a-takedown-order-for-fable)
10. 我们不是说DoW之争与此相关,但…(https://thezvi.substack.com/i/202117817/we-are-not-saying-the-dow-fight-is-related-and-yet)
11. 虚无主义者。(https://thezvi.substack.com/i/202117817/the-nihilists)
12. 基本无害。(https://thezvi.substack.com/i/202117817/mostly-harmless)
13. 每个人,意味着每个人。(https://thezvi.substack.com/i/202117817/everyone-means-everyone)
14. 这可能是好场景,且主要是个误解。(https://thezvi.substack.com/i/202117817/this-could-be-the-good-scenario-and-mostly-a-misunderstanding)
15. 下一步。(https://thezvi.substack.com/i/202117817/the-next-step)
16. 最糟糕的许可制度是完全临时的。(https://thezvi.substack.com/i/202117817/the-worst-licensing-regime-is-fully-ad-hoc)
17. 我们正在展示我们是不可靠的合作伙伴。(https://thezvi.substack.com/i/202117817/we-are-showing-we-are-unreliable-partners)
政府自己的说法是,Anthropic在回应时“缺乏严肃性”,导致政府实施了出口管制。
如果相信Axios和Politico,所谓“缺乏严肃性”是指Anthropic:
1. 没有匆忙下架Fable,并以超级顺从和严肃的态度行事。
2. 针对一个GPT-5.5也能做、且无需任何越狱的越狱手段。
3. 没有提供任何细节。
4. 反而要求了解事件的细节。
5. 这一切发生在周五下午90分钟内。
所以基本上就是:“Anthropic只想基于理由做事,因此我们判断‘氛围不对’,所以去他的,我们要把一切炸掉,显示谁才是老大。”
这也是第二次出现“我们就差那么一分钟没联系上Dario,所以不得不在周五下午5点后炸掉整个美国AI政策”(https://x.com/SophiaCai99/status/2065942612293365948)作为借口。Emil Michael也曾用过。
这次,说法是他当时在“健康静修”,但Anthropic明确否认,当时在场的Ashlee Vance也**明确否认**(https://x.com/ashleevance/status/2066010098934427653)。
Anthropic表示,在Dario被要求后75分钟内就让他接上了电话,而且在此期间其他Anthropic高管也已安排就绪。我相信他们。
白宫等待的时间远超过75分钟——事实上他们等了一整夜,在接到亚马逊联系后才开始尝试联系Dario。
关于事件和时间线的细节继续涌现(https://www.axios.com/2026/06/13/anthropic-amazon-white-house)。首先是Axios:
> Maria Curi(Axios):**幕后故事:**知情人士透露,亚马逊在周四晚致电政府官员,分享了一份报告,显示他们如何越狱并访问了Anthropic新强大模型Mythos中构成国家安全威胁的部分。- Anthropic此前曾多次通知政府计划在6月9日发布Fable——这是Mythos的通用版本——政府并未反对,公司知情人士称。- 但亚马逊以及至少其他五家公司在周四晚和周五上午给多位政府高级官员打电话,最终导致该模型在周五晚被关停。
亚马逊被确认为核心来电方,这促使白宫开始采取行动,最终导致Fable下架。
正如我上次讨论的,Anthropic的发布公告中明确警告过,类似亚马逊所做的越狱程度是可能发生的。我毫不怀疑他们曾向政府详细通报过这些细节。
有人记得Fable 5发布公告中的这张图吗?
[](https://substackcdn.com/image/fetch/$s_!-t2P!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F3c321f20-72e5-4893-877a-adea6859fbd5_967x731.jpeg)
我不明白为什么亚马逊的CEO要为此打电话给白宫。那里有一个关键信息是我们不知道的。
然后,从亚马逊最初致电算起,Anthropic被给予不到24小时,且未获得任何关于实际令人担忧事件的细节,之后就被“周五下午5点后”的经典命令打击。在不到24小时的绝大部分时间里,政府甚至还没有尝试就此事联系Anthropic。
我们有白宫消息来源证实——即使我们完全相信他们的说法——他们决定冒着炸毁整个美国AI的风险,是因为**他们在90分钟的电话中**(https://www.axios.com/2026/06/13/anthropic-fable-takedown)**不喜欢获得的“氛围”**(https://www.politico.com/news/2026/06/13/inside-the-whirlwind-24-hours-that-led-the-white-house-to-slap-export-controls-on-anthropic-00961519?utm_medium=twitter&utm_source=dlvr.it)。
> Sophia C和Cheyenne Haslett(https://www.politico.com/news/2026/06/13/inside-the-whirlwind-24-hours-that-led-the-white-house-to-slap-export-controls-on-anthropic-00961519):这一举动发生在Anthropic CEO Dario Amodei与政府官员(包括财政部长Scott Bessent和白宫网络主管Sean Cairncross)多次紧张通话之后,凸显了白宫如何在实时应对快速发展的潜在危险AI模型所带来的监管难题。……会议之后,政府试图联系Amodei,但被告知他因参加健康静修而无法接听——一位政府官员和一位白宫高级官员说。Anthropic发言人否认了他在健康静修的说法,称**“这绝对是假的。”** **接近Anthropic的人士称,Amodei大约在中午时分被首次要求联系,并在1小时15分钟内与高级官员通了电话。** 在他暂时无法联系期间,Anthropic提供了其他高管替代,该知情人士说。当政府最终联系到Amodei时,他参与了三次电话会议,与大约六名政府高级官员(包括Cairncross、Bessent和商务部长Howard Lutnick)交谈——白宫高级官员和一名政府官员表示。……在通话中,Amodei试图澄清他认为是误解的情况。他反驳了政府的担忧,为其安全防护措施辩护,并认为出现的这种绕过方式(他认为是特定性的)并不像更广泛的“越狱”那样构成同样的风险——后者能让模型完全脱离Anthropic所设置的防护措施。
Dario试图解释这是一个狭义问题,但他们根本不理解或不相信他,或者选择不去理解或相信他。
我们现在知道,Dario完全正确:这个问题是狭义且无害的。
Dario错在,他以为那些与他交谈的人既有能力也有兴趣理解他想说的话。
> 白宫高级官员和两名政府官员称,他们敦促Anthropic自愿移除模型,并与政府协调解决漏洞。Amodei要求更多时间和信息,但并未承诺撤下模型;白宫高级官员说,有一次Bessent直接告诉Amodei,他做了一个“糟糕的决定”。……“出口管制是最后手段,因为我们求了他们几个小时,让他们与我们合作,”白宫高级官员说。“这不是我们想做的,但我们别无选择。”发稿后,接近Anthropic的人士之一反驳说,公司并没有被给予自愿与政府合作的选择。“白宫给了90分钟时间下线模型,没有提供任何关于实际威胁的细节,”该人士说。“从来没有‘求’或‘要求’他们与我们合作,只给了一个宣布的90分钟截止时间。”**tae kim**(https://x.com/firstadopter/status/2066495896359977419):FT确认:“Anthropic被给予90分钟遵守,在下令之前没有收到详细关切——接近公司的人士称。”
你认为白宫是在“求了几个小时”吗?还是说他们只是在抛出一些词,最好情况下也只是“我们还没有正式下令”的代号?
我没有理由不相信Anthropic。Dario试图解释这是误报,并要求提供细节。白宫没有提供任何支持其说法的细节,也没有证据表明此举必要或审慎。他们只是说“90分钟内移除Fable”,很可能没有明确说明“否则就是IFAR”。
看来,很大程度上激怒他们的是,Anthropic想要理由,而不是在被命令跳的时候问跳多高。
而且,Dario总体上未能承诺——无论什么情况——都问跳多高。
> **Axios:底线:**了解政府想法的消息来源称,Anthropic在发布Fable时表现出“缺乏严肃性”。“如果Anthropic认真对待此事,而不是将其视为孤立事件并予以否认,而是着手修复或暂停访问,这事根本就不会发生,”该消息人士说,并补充道“他们过于自信了。”
也就是说,他们告诉我们我们错了。这意味着他们不严肃。他们怎么可能比财政部长更了解情况呢?
> **快速回顾:**周五下午1点(美东时间),Anthropic接到政府电话,指示他们撤销Mythos和Fable的发布。
相似文章
美国政府封禁Anthropic模型与AI越狱无关
美国政府发布出口管制指令,以国家安全为由强制Anthropic将其Fable 5和Mythos 5 AI模型下线。安全研究人员认为,所谓的护栏绕过并不足以证明此类行动的合理性,且此举损害了美国的网络防御能力。
Anthropic 表示将下架 Claude Fable 5 以遵守美国政府命令
Anthropic 在收到美国政府以国家安全为由的出口管制指令后,禁用了其 Claude Fable 5 和 Mythos 5 AI 模型,此举加剧了该公司与特朗普政府之间的紧张关系。
Anthropic 是否自食其果?
一篇文章主张,Anthropic 首席执行官 Dario Amodei 的政策声明主张政府有权阻止人工智能部署,直接导致美国政府限制对 Anthropic 最新模型 Claude Fable 和 Claude Mythos 的访问。
Anthropic 仍与白宫就 Claude Fable 5 存在分歧
Anthropic 与特朗普政府就其 Claude Fable 5 模型的出口管制存在争议,此前白宫因越狱担忧而施加限制,该担忧源于亚马逊首席执行官安迪·贾西向财政部长斯科特·贝森特提出的问题。Anthropic 与政府官员的谈判已结束,未解除管制,商务部表示若 Anthropic 完全解决漏洞则愿意进行谈判。
围绕Claude Mythos 5之争的内幕
特朗普政府向Anthropic发布出口管制指令,以安全为由要求暂停其Mythos 5和Fable 5 AI模型的访问权限,此举引发紧急谈判,可能重塑AI行业。