Anthropic 为网络合作伙伴提供 Mythos 升级版，并为其他用户提供“安全”版本

Wired 2026/06/09 17:00 模型

anthropic claude ai-safety cybersecurity model-release guardrails mythos-5 fable-5

摘要

Anthropic 发布了 Claude Fable 5（公开版本，带有安全防护措施）和 Claude Mythos 5（仅限合作伙伴使用），提供先进的网络安全能力，同时限制访问以防止滥用。

Anthropic 向受信任的组织发布 Claude Mythos 5，并向公众发布 Claude Fable 5，后者据称无法用于网络攻击。

查看原文

查看缓存全文

缓存时间: 2026/06/10 00:19

# Anthropic 为网络合作伙伴推出 Mythos 升级版，并为其他人提供“安全”版本来源：https://www.wired.com/story/anthropic-releases-claude-fable-5-mythos-5/ Anthropic 周二发布了两款新 AI 模型，名为 Claude Fable 5 和 Claude Mythos 5。该公司表示，这些模型的能力超越了其今年 4 月向有限技术行业合作伙伴发布的 Mythos（https://www.wired.com/story/anthropics-mythos-will-force-a-cybersecurity-reckoning-just-not-the-one-you-think/）预览模型（https://www.wired.com/story/anthropic-mythos-preview-project-glasswing/）。Anthropic（https://www.wired.com/tag/anthropic/）曾表示，最初限制发布是由于担心该模型的能力可能被恶意行为者利用，开发出让防御者（https://www.wired.com/story/mozilla-used-anthropics-mythos-to-find-271-bugs-in-firefox/）措手不及的黑客工具。 Anthropic 目前仅向有限的一组行业合作伙伴发布 Claude Mythos 5，其中许多合作伙伴已经获得了 Mythos Preview 的访问权限。该公司表示，正在与美国政府就此次发布进行合作。 Claude Fable 5 将公开发布，它使用与 Mythos 5 相同的基础模型，但该公司周二表示，在发布时将设置“护栏”，阻止模型回答许多与网络安全、生物学和化学相关的用户问题。这些请求将被转接到较旧的 AI 模型 Claude Opus 4.8。Anthropic 表示，如果怀疑用户试图对 Claude Fable 5 进行蒸馏（https://www.wired.com/story/elon-musk-distill-openai-models-partly-xai/）——即利用大型 AI 模型的响应来训练较小的 AI 模型——这些请求也将被转接到 Claude Opus 4.8。在接受 WIRED 采访时，Anthropic 的产品管理主管 Diane Penn 表示，自 4 月发布之前，公司就一直在思考如何处理 Mythos 的软件漏洞发现能力及其他高级能力，但此后进行的测试和用户反馈帮助完善了策略。 “我们正试图以有益的方式进行改进，即使一开始无法为每个用例提供完美的（解决方案），”Penn 说。“在众多不同方法中，这种方法是最可行、最好的。我们最终觉得，这是让用户从 Fable 5 中获得最大价值的最佳产品选择。” 目前，Penn 表示，保护机制的设计偏向于谨慎，这意味着一些用户查询即使无害，也可能被路由到能力较弱的 AI 模型。随着时间的推移，Anthropic 希望提高其分类器的精确度，但 Penn 表示，这是目前公司能够广泛发布该模型的唯一安全方式。该公司周二表示，除了向 Project Glasswing 合作伙伴提供 Claude Mythos 5 外，还向“选定的生物学研究人员”授予访问权限。此外，Anthropic 在其关于周二发布的博文（https://www.anthropic.com/news/claude-fable-5-mythos-5）中指出，它向这些少数客户群体提供不受限制的版本，“直到我们的可信访问计划可用”，暗示未来计划扩大访问范围。自 4 月 Mythos 发布以来，Anthropic 反复强调，最终其私营领域甚至开放权重的竞争对手也将不可避免地提供具有 Mythos 级别能力的模型。 Claude Mythos 和其他新 AI 模型设计黑客工具的能力，能够发现并利用新旧软件中的漏洞，这迫使世界各地的科技公司和政府在这些级别的 AI 模型被广泛提供给攻击者之前，加强其软件防御。Anthropic 最初通过名为 Project Glasswing 的联盟向行业合作伙伴发布 Mythos，其理念是让成员在更广泛发布之前，能够提前准备自己的系统并权衡全球性的解决方案。 Anthropic 上周在一篇关于 Project Glasswing 的更新（https://www.anthropic.com/news/expanding-project-glasswing）中写道：“我们正在尽可能快地努力，安全地将 Mythos 级别能力以通用访问形式发布。为此，我们需要极其强大的保障措施，防止模型的网络能力被滥用——这些保障措施我们（并且据我们所知，所有其他 AI 开发者）尚未开发出来。” Anthropic 表示，Claude Fable 5——以文学体裁命名，与公司现有的 Haiku、Sonnet 和 Opus 模型类似——在软件工程和需要视觉理解的任务上表现更佳。但这种提升的性能是有代价的。Claude Fable 5 和 Claude Mythos 5 对开发者的收费为每百万输入 token 10 美元，每百万输出 token 50 美元——是 Anthropic 公开可用的 AI 模型价格的两倍，但比 Mythos Preview 便宜。 Claude Fable 5 被阉割的发布暗示了 Anthropic 的业务矛盾：希望在科技行业解决这些模型的网络安全问题之前，公开发布 Mythos 级别的 AI 模型。今年 4 月，OpenAI 也私下发布了一款声称具有高级网络安全能力的模型（https://www.wired.com/story/in-the-wake-of-anthropics-mythos-openai-has-a-new-cybersecurity-model-and-strategy/），并组建了类似 Project Glasswing 的工作组。OpenAI（https://www.wired.com/story/openai-confidentially-files-for-ipo/）和 Anthropic（https://www.wired.com/story/anthropic-files-s1-ipo-sec/）均已秘密提交 IPO 申请，并争先恐后地给潜在投资者留下深刻印象，最早可能今年就上市。然而，即使作为临时解决方案，Claude Fable 5 的保障措施在实际环境中的抗性仍有待观察。Anthropic 表示，在超过 1000 小时的红队测试中，测试人员没有发现该模型的通用越狱方法。尽管如此，对开发足够保护措施的担忧是该公司最初在 4 月未向公众发布 Mythos 级别模型的主要理由，并且这些担忧似乎持续存在（https://www.anthropic.com/research/glasswing-initial-update）。

Anthropic 为网络合作伙伴提供 Mythos 升级版，并为其他用户提供“安全”版本

相似文章

Anthropic 的 Claude Fable 5 是公众今天可以访问的 Mythos 版本

Claude Fable 5 和 Claude Mythos 5

Anthropic 为 Claude Code 和 Claude Security 准备 Mythos 1（2 分钟阅读）

Anthropic 发布首个 Mythos 级模型 Claude Fable

Claude Mythos 开启网络安全的潘多拉魔盒

提交意见反馈