首页
/
模型
/
Anthropic 为网络合作伙伴提供 Mythos 升级版,并为其他用户提供“安全”版本
Anthropic 为网络合作伙伴提供 Mythos 升级版,并为其他用户提供“安全”版本
摘要
Anthropic 发布了 Claude Fable 5(公开版本,带有安全防护措施)和 Claude Mythos 5(仅限合作伙伴使用),提供先进的网络安全能力,同时限制访问以防止滥用。
Anthropic 向受信任的组织发布 Claude Mythos 5,并向公众发布 Claude Fable 5,后者据称无法用于网络攻击。
查看缓存全文
缓存时间:
2026/06/10 00:19
# Anthropic 为网络合作伙伴推出 Mythos 升级版,并为其他人提供“安全”版本
来源:https://www.wired.com/story/anthropic-releases-claude-fable-5-mythos-5/
Anthropic 周二发布了两款新 AI 模型,名为 Claude Fable 5 和 Claude Mythos 5。该公司表示,这些模型的能力超越了其今年 4 月向有限技术行业合作伙伴发布的 Mythos(https://www.wired.com/story/anthropics-mythos-will-force-a-cybersecurity-reckoning-just-not-the-one-you-think/)预览模型(https://www.wired.com/story/anthropic-mythos-preview-project-glasswing/)。Anthropic(https://www.wired.com/tag/anthropic/)曾表示,最初限制发布是由于担心该模型的能力可能被恶意行为者利用,开发出让防御者(https://www.wired.com/story/mozilla-used-anthropics-mythos-to-find-271-bugs-in-firefox/)措手不及的黑客工具。
Anthropic 目前仅向有限的一组行业合作伙伴发布 Claude Mythos 5,其中许多合作伙伴已经获得了 Mythos Preview 的访问权限。该公司表示,正在与美国政府就此次发布进行合作。
Claude Fable 5 将公开发布,它使用与 Mythos 5 相同的基础模型,但该公司周二表示,在发布时将设置“护栏”,阻止模型回答许多与网络安全、生物学和化学相关的用户问题。这些请求将被转接到较旧的 AI 模型 Claude Opus 4.8。Anthropic 表示,如果怀疑用户试图对 Claude Fable 5 进行蒸馏(https://www.wired.com/story/elon-musk-distill-openai-models-partly-xai/)——即利用大型 AI 模型的响应来训练较小的 AI 模型——这些请求也将被转接到 Claude Opus 4.8。
在接受 WIRED 采访时,Anthropic 的产品管理主管 Diane Penn 表示,自 4 月发布之前,公司就一直在思考如何处理 Mythos 的软件漏洞发现能力及其他高级能力,但此后进行的测试和用户反馈帮助完善了策略。
“我们正试图以有益的方式进行改进,即使一开始无法为每个用例提供完美的(解决方案),”Penn 说。“在众多不同方法中,这种方法是最可行、最好的。我们最终觉得,这是让用户从 Fable 5 中获得最大价值的最佳产品选择。”
目前,Penn 表示,保护机制的设计偏向于谨慎,这意味着一些用户查询即使无害,也可能被路由到能力较弱的 AI 模型。随着时间的推移,Anthropic 希望提高其分类器的精确度,但 Penn 表示,这是目前公司能够广泛发布该模型的唯一安全方式。
该公司周二表示,除了向 Project Glasswing 合作伙伴提供 Claude Mythos 5 外,还向“选定的生物学研究人员”授予访问权限。此外,Anthropic 在其关于周二发布的博文(https://www.anthropic.com/news/claude-fable-5-mythos-5)中指出,它向这些少数客户群体提供不受限制的版本,“直到我们的可信访问计划可用”,暗示未来计划扩大访问范围。自 4 月 Mythos 发布以来,Anthropic 反复强调,最终其私营领域甚至开放权重的竞争对手也将不可避免地提供具有 Mythos 级别能力的模型。
Claude Mythos 和其他新 AI 模型设计黑客工具的能力,能够发现并利用新旧软件中的漏洞,这迫使世界各地的科技公司和政府在这些级别的 AI 模型被广泛提供给攻击者之前,加强其软件防御。Anthropic 最初通过名为 Project Glasswing 的联盟向行业合作伙伴发布 Mythos,其理念是让成员在更广泛发布之前,能够提前准备自己的系统并权衡全球性的解决方案。
Anthropic 上周在一篇关于 Project Glasswing 的更新(https://www.anthropic.com/news/expanding-project-glasswing)中写道:“我们正在尽可能快地努力,安全地将 Mythos 级别能力以通用访问形式发布。为此,我们需要极其强大的保障措施,防止模型的网络能力被滥用——这些保障措施我们(并且据我们所知,所有其他 AI 开发者)尚未开发出来。”
Anthropic 表示,Claude Fable 5——以文学体裁命名,与公司现有的 Haiku、Sonnet 和 Opus 模型类似——在软件工程和需要视觉理解的任务上表现更佳。但这种提升的性能是有代价的。Claude Fable 5 和 Claude Mythos 5 对开发者的收费为每百万输入 token 10 美元,每百万输出 token 50 美元——是 Anthropic 公开可用的 AI 模型价格的两倍,但比 Mythos Preview 便宜。
Claude Fable 5 被阉割的发布暗示了 Anthropic 的业务矛盾:希望在科技行业解决这些模型的网络安全问题之前,公开发布 Mythos 级别的 AI 模型。今年 4 月,OpenAI 也私下发布了一款声称具有高级网络安全能力的模型(https://www.wired.com/story/in-the-wake-of-anthropics-mythos-openai-has-a-new-cybersecurity-model-and-strategy/),并组建了类似 Project Glasswing 的工作组。OpenAI(https://www.wired.com/story/openai-confidentially-files-for-ipo/)和 Anthropic(https://www.wired.com/story/anthropic-files-s1-ipo-sec/)均已秘密提交 IPO 申请,并争先恐后地给潜在投资者留下深刻印象,最早可能今年就上市。
然而,即使作为临时解决方案,Claude Fable 5 的保障措施在实际环境中的抗性仍有待观察。Anthropic 表示,在超过 1000 小时的红队测试中,测试人员没有发现该模型的通用越狱方法。尽管如此,对开发足够保护措施的担忧是该公司最初在 4 月未向公众发布 Mythos 级别模型的主要理由,并且这些担忧似乎持续存在(https://www.anthropic.com/research/glasswing-initial-update)。
相似文章
TechCrunch AI
Anthropic 发布了 Claude Fable 5,这是其强大的 Mythos 模型的公开可访问版本,配备安全护栏,可阻止高风险领域的响应,并回退到较弱的模型。此次发布是在 Anthropic 警告 AI 变得过于危险并推动协调安全措施之后进行的。
Anthropic News
Anthropic 推出了 Claude Fable 5,这是一款具有安全防护的最先进模型,同时还有用于网络防御的 Claude Mythos 5,两款模型的定价均低于之前的型号。
TLDR AI
Anthropic 正准备推出 Mythos 1,一款用于网络安全的强大 AI 模型,其预览标签已出现在 Claude Code 和 Claude Security 中。该模型最初受到限制,一旦安全措施到位,可能会更广泛地发布,同时正在开发一个新的安全仪表板。
The Verge
Anthropic 宣布推出 Claude Fable 5,这是其迄今最强大的广泛可用 AI 模型,属于此前被认为过于危险而不得公开发布的 Mythos 系列。该模型引入了新的安全机制,在高风险领域会降级至 Opus 4.8。
Reddit r/artificial
Anthropic 发布了 Claude Mythos,这是一款能力极强的 AI 模型,旨在自动发现操作系统、浏览器和软件库中的安全漏洞。出于双重用途风险的考虑,该模型最初仅通过 Project Glasswing 向部分企业和开源合作伙伴开放,此次发布引发了业界关于 AI 安全能力与企业营销策略的广泛争论。