这个Fable模型上空笼罩着一层阴影

Hacker News Top 2026/06/13 05:16 新闻

anthropic fable mythos ai-regulation national-security jailbreaking export-control

摘要

美国政府因安全担忧一个越狱方法，指示Anthropic禁用其Fable和Mythos模型的访问权限。Anthropic遵照执行，关闭了全球所有客户的访问。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/06/13 14:44

# 科技杂谈：Fable 事件背后笼罩着巨大阴影来源：https://12gramsofcarbon.com/p/tech-things-there-is-a-massive-shadow 好吧。我本来没打算今晚写东西，毕竟是周五，周五我喜欢写代码——准确说是让智能体写代码，我则和朋友一起看球赛。最近我做了几个好玩的 HTML 游戏。实际上我另一篇草稿正在酝酿，关于 AI 工具让制作有趣小游戏变得如此容易，我预计“Flash 游戏”复兴即将到来。但正当我琢磨如何让我那款劣质后室主题射击游戏玩起来更顺畅时，智能体突然弹出：“抱歉！这个模型已不存在！” [](https://substackcdn.com/image/fetch/$s_!mY4d!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F9a00b60c-a15c-4c7d-9097-a1090bd9c28f_967x412.png) 搞什么鬼？我第一反应是得重新登录。我平时经常并行运行一堆智能体，所以直觉告诉我这只是个*极其*奇怪的限流错误。我隐约知道 Anthropic 正考虑将 Fable 从订阅计划中移除，于是切到 API。依然无法访问。我的团队搭建了一个定制的 Rust 智能体客户端，相当不错。但我下一个念头是“操，框架崩了”，于是开始捣鼓 Rust——尽管号称写过几万行代码，但这语言我几乎不懂。这时朋友说：“政府封禁了 Fable。” 搞什么鬼？但这是真的。 [](https://substackcdn.com/image/fetch/$s_!puNA!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F287175c0-86c8-4300-a63d-d9dad38ed37c_1593x471.png) 美国政府指示 Anthropic 禁止全球任何外国国民（包括美国境内的外国国民及 Anthropic 的外籍员工）访问 Fable 和 Mythos。这是一个不可能完成的要求，政府心知肚明，因此 Anthropic 已禁用所有对 Fable/Mythos 的访问（https://www.anthropic.com/news/fable-mythos-access）。 > 美国政府援引国家安全法规，发布出口管制指令，要求暂停所有外国国民（无论在美国境内还是境外，包括 Anthropic 的外籍员工）对 Fable 5 和 Mythos 5 的访问。该指令的实际效果是，我们必须立即为所有客户禁用 Fable 5 和 Mythos 5 以确保合规。所有其他 Anthropic 模型的访问不受影响。……我们于今日东部时间下午 5:21 收到政府指令。信函未提供国家安全担忧的具体细节。我们的理解是，政府认为已发现一种绕过或“越狱”Fable 5 的方法。我们审查了该特定技术的演示，其被用于识别少量先前已知的微小漏洞。这些漏洞似乎都相对简单，且我们发现其他公开可用的模型无需绕过也能发现这些漏洞。我们审查了一份我们认为政府指令依据的报告，并验证了其中展示的能力在其他模型（包括 OpenAI 的 GPT-5.5）中广泛可用，且每天被维护系统安全的防御者所使用。我们将在未来 24 小时内分享更多细节。……我们遵守政府的法律指令，将移除所有用户对 Fable 5 和 Mythos 5 的访问权限。然而，我们不同意将发现一个狭窄的潜在越狱漏洞作为召回一个已部署给数亿人的商业模型的原因。几点想法。 - 首先，我内心极其矛盾。 - 多数日子里我是个 AI 末日论者。训练过众多深度神经网络，我深知优化器可能出错的方式。我们优化的是可衡量的东西，而非我们真正想达成的目标。我们希望并祈祷两者一致，但往往并非如此。我们想做出好产品，但不知如何做，于是优化参与度。我们想教孩子读写，但不知如何教，于是优化考试成绩。我们想改善经济，但不知如何做，于是杀死成千上万头鲸鱼，任其尸体在码头腐烂（https://slate.com/news-and-politics/2022/06/history-of-soviet-whaling-greenpeace-twentieth-century.html）。AGI/ASI 系统是优化器，而优化器可能极其危险，其方式极难预测，因为它们在努力优化可衡量之物时，会优化掉好的方面。企业也是优化器，当然它们优化的是“尽快赚钱”——这个可衡量的东西——尽管许多构建者心里清楚“嗯对，这真的很危险”，这简直就是整个 AI 对齐争论的一个*绝妙*寓言（https://12gramsofcarbon.com/p/tech-things-openai-is-an-unaligned-7d6?utm_source=publication-search）。 - 但同样，整件事背后笼罩着巨大阴影。如果美国历史上任何其他政府采取这一步骤，我们有理由至少给予该政府信任。但*当前*政府已表现出完全令我震惊的小气和腐败，其公开性和创造力令人咋舌。这是出于监管 AI 的实际需求吗？更好的问题是：这个政府中*任何*懂 AI 的人，真的能影响决策者吗？我赌不能！ - Anthropic 和本届行政当局众所周知关系不睦。我承认自己有偏见，但在我眼中，Anthropic 竭尽全力与国防部整合、与军方合作，结果 Anthropic 模型被用于高度机密系统中。而特朗普政府则公开试图实施企业谋杀，宣布 Anthropic 为供应链风险，禁止任何与政府合作的人员（基本所有人）使用任何 Anthropic 模型。尽管如此，后续 6 个月（包括整个委内瑞拉战争和伊朗战争）中，军方仍在继续使用 Anthropic 模型。中国的 LLM 甚至都没被宣布为供应链风险！无论如何，这成了公开话题，极右翼推特势力认定，因为特朗普政府试图摧毁 Anthropic，Anthropic 必然是觉醒派，而觉醒派必须被摧毁，所以特朗普政府摧毁 Anthropic 是对的。1（https://12gramsofcarbon.com/p/tech-things-there-is-a-massive-shadow#footnote-1）那么，这届政府是在试图适当监管有害 AI？还是将此视为给感知中的文化敌人一记黑拳的机会？ - 与此同时，Anthropic 的竞争对手在政府内上下都有朋友——例如，Kushner 家族在 OpenAI 有大量投资。2（https://12gramsofcarbon.com/p/tech-things-there-is-a-massive-shadow#footnote-2）所以另一种解读是，这也是其他*实验室*给 Anthropic 一记黑拳的机会。据各方说法，Fable 是一个非常强大的模型。它恰好在消费者无法访问时消失，尤其是 Anthropic 即将 IPO 之际，这实在太巧了。 - 分赃制政治的问题在于，它让*一切*的观感都变得可疑。我们社会花了几十年才达到决定不这么做的那一点，而现在那种信任已经消失。又是*一个漫长*的阴影。 - 简短插一句，我再次对硅谷的许多人极度失望，他们曾激烈争辩民主党领导的政府会“在 AI 竞赛中挑选赢家和输家”，现在却对现任政府的行为完全沉默或辩护。我不禁觉得之前的姿态不过是马基雅维利式的权力游戏，这种感觉糟糕透顶。科技行业在全世界名声不佳，尤其是 AI 领导者们总说 AI 会摧毁一切、导致大规模失业。要是有人能有足够的脊梁3（https://12gramsofcarbon.com/p/tech-things-there-is-a-massive-shadow#footnote-3）站出来坚持原则说“嘿，这有点操蛋”，那就好了！ - 这一消息于周五下午 5:21 宣布。时间点有点可疑。每当有人在周五晚上故意做某事，我的第一反应是“哦，市场影响”。如果你要做可能非常糟糕的事，就在周五晚上宣布，这样周末有时间让股市消化，希望不致立即崩盘。特朗普政府不是第一次用这招了。来自 Claude（是的，我知道讽刺之处）： > 最常被引用的汇编来自研究公司 Kobeissi Letter，它记录了一系列在周五期货市场收盘后或周六早间发布的主要地缘政治和贸易公告，利用周末消化冲击。据其清单，包括 6 月 21 日对伊朗核设施的空袭、9 月 1 日美国对加勒比毒品船只的军事行动、10 月 10 日市场收盘后对中国的 100% 关税威胁、11 月 29 日关闭委内瑞拉领空、12 月 25 日在尼日利亚的军事行动，以及 2026 年 2 月 28 日对伊朗的直接打击。他们还指出企业角度：2025 年 8 月 11 日，政府在 CEO Lip-Bu Tan 面临数周公开压力后宣布了一项英特尔交易，同样安排在非交易时段。 - 为什么这可能是一个动荡的决定？AI 热潮的一个巨大基础是：对计算机智能的需求将持续存在。债务、建设、数据中心、股市中从 GPU 到内存到磁盘到服务器机架的整条 AI 链条，*全部*都建立在这种认知上：这一切将价值数万亿甚至更多美元。而据各方说法，似乎确实如此。或者说，至少曾有望如此。你知道什么会给数万亿美元的数据中心投资带来阻碍吗？意识到政府随时可能单方面切断所有人的访问，而数据中心将一文不值。HN 和 Reddit 上已经有人讨论这代表了政府“允许”人们访问的最高水位。就算有全世界最多的需求，如果政府不让你拥有，那也一文不值。 - 说到 HN/Reddit 的网友，许多人幸灾乐祸地表示 Anthropic 为他们用 Mythos 搞的“营销噱头”付出了代价。我之前说过，这不是我们第一次看到 AI CEO 为个人利益宣称某物“不安全”。（https://12gramsofcarbon.com/i/197684329/everyones-getting-hacked） > Anthropic 的反对者纷纷谴责这一举动不过是广告与作秀。OpenAI 也曾为那个惊天动地、终结世界的 AI——GPT-2（https://archive.is/N24lQ#selection-1821.0-1829.316）上演过同样的“太危险不能发布”的戏码。 > 由于担心大语言模型被大规模用于生成欺骗性、偏见性或辱骂性语言，我们只发布一个更小版本的 GPT-2 及采样代码。我们不发布数据集、训练代码或 GPT-2 模型权重。大约一年前，我们在 OpenAI 宪章中写道：“我们预计安全与安保方面的担忧将减少我们未来的传统出版，而增加分享安全、政策和标准研究的重要性。”我们认为当前工作可能代表了这类担忧的早期开端，且预计其将随时间增长。我有点调侃，但值得注意的是 OpenAI 的担忧其实相当准确。自 GPT-2 发布以来，AI 垃圾邮件泛滥，把我们集体理解现实的能力撕裂得体无完肤。我有点相信 Fable 是货真价实的东西，也有点信任 Anthropic 说他们担心广泛发布 Fable 的安全风险。但相关 HN 讨论串中得票最高的评论（https://news.ycombinator.com/item?id=48511106）是：“终于，他们要为自己一直用来推销模型（宣称比所有其他模型领先太多）的恐吓策略付出代价了。”现在没人能用 Fable 了……所以，算他们赢了吧？当然，这很可能是 Anthropic 能想象到的最好的广告。如果你把政府的话当真，那模型好到根本不能用！ - 关于认真对待人们的话，有些人也表示（https://news.ycombinator.com/item?id=48511330）“当你花大量时间告诉别人你的产品有多危险时，有权禁止危险产品上市的人可能会听进去。”老实说，这是个好论点！伯尼·桑德斯，国会中最受 AI 影响的成员，一直在制作政策视频，内容就是朗读 AI CEO 们的引述，然后说“看到了吗？！”当然，这又回到第一点：也许这些东西*真的*不安全，*应该*受到监管。当然，任何称职的 AI CEO 如果知道面临被关闭的风险，再也不会说这种话了。 - 我想以另一个 HN 评论（https://news.ycombinator.com/item?id=48512685）结尾，它非常贴近我的感受。 > 这么多评论忽略了全局，只是幸灾乐祸地指出 Anthropic 活该，或者说这是某种营销噱头的自然结果。真正的故事是：这可能是政府开始限制公众获取强大 LLM 的开端，限制*你*。Fable 是市场上最强的模型，而美国政府告诉你你不能用它（技术上只有非美国公民不能用，但实际上即使你是美国公民也用不了）。如果你以为解决方案会是开源的中国模型和/或自己运行硬件，再想想。你认为一年后，当中国公司拥有 Mythos 级别的能力时，如果美国政府将美国最强的模型捂在手里，中国会允许其境内最强的 LLM 开源吗？不太可能。这些正在变成强大的网络安全武器，国家将有利益去限制和控制它们。两年后，如果最强的 LLM 还普遍可用，我会感到惊讶。我们会因此变得更贫乏，还是更安全？我认为是更贫乏，因为我讨厌被告诉能用什么技术、不能用什么技术，但我不确定。也许你认为政府应该限制强大的 LLM，也许你不认为。但无论如何，这是大新闻，一条红线被跨越，一个先例被树立。即使此举的动机仅仅是政府和 Anthropic 算旧账，这一点依然成立。说得好。 #### 关于本文的讨论 ### 想了解更多？

这个Fable模型上空笼罩着一层阴影

相似文章

我们的AI账单是受补贴的，我认为很多人没有预料到接下来会发生什么

Anthropic

随着Anthropic暂停新模型访问，印度讨论其AI未来

据报道，Meta在接到北京要求后开始撤销20亿美元Manus交易

美国政府关闭了Anthropic最强大的AI，面向全球——仅上线72小时后

提交意见反馈