@karpathy: 这是一个超激动人心的发布——Claude Fable 5 与 Mythos 使用相同的基础模型,但增加了安全措施。……
摘要
Claude Fable 5 已发布,据称在各项基准测试中达到最先进水平,并在质量上有改进,尤其在复杂长任务上。它与 Mythos 使用相同的基础模型,但增加了安全措施。
查看缓存全文
缓存时间: 2026/06/10 00:17
这是一个令人非常激动的发布——Claude Fable 5 与 Mythos 采用相同的底层模型,但增加了安全防护措施。各项基准测试表现优异,全面达到当前最优水平(SOTA)并拉开明显差距,但我还要补充一点:在质量层面(定性而言),这也是一个值得版本号大版本更新的阶梯式进步(在我看来,其提升幅度与去年11月的Claude 4.5相当),尤其是在处理极难问题的长时求解会话中,表现尤为突出。你可以给它设定比以往更有野心的任务,模型能“理解”你的意图并自主推进,让人几乎舍不得移开目光去检查代码(不过生产环境中还是别这么干!)。模型仍存在一些用户会遇到的小问题,并且当前的安全防护机制在发布时设置得稍显敏感,希望后续能通过调校逐步优化。
我感觉很多事情正在改变——可运行的软件越来越像自来水一样随取随用。杰文斯悖论正在发挥作用,我对软件的需求本身也在大幅增长。你可以要求任何东西:解释工具、可视化面板、仪表盘、定制化的单次使用应用(比如一个完全针对你项目的超具体wandb)、将你的测试套件扩展10倍、自动优化代码、运行大型研究项目并生成自定义HTML结果……什么都行!“解放你的思想”(《黑客帝国》梗)。非常期待大家即将创造的一切!
Claude (@claudeai): Fable 5 在几乎所有测试的基准上都达到了业界领先水平,在软件工程、知识工作、科学研究和视觉领域表现尤为卓越。
任务越长越复杂,Fable 5 相较于我们其他模型的领先优势就越大。
相似文章
Anthropic 发布首个 Mythos 级模型 Claude Fable
Anthropic 宣布推出 Claude Fable 5,这是其迄今最强大的广泛可用 AI 模型,属于此前被认为过于危险而不得公开发布的 Mythos 系列。该模型引入了新的安全机制,在高风险领域会降级至 Opus 4.8。
Anthropic 的 Claude Fable 5 是公众今天可以访问的 Mythos 版本
Anthropic 发布了 Claude Fable 5,这是其强大的 Mythos 模型的公开可访问版本,配备安全护栏,可阻止高风险领域的响应,并回退到较弱的模型。此次发布是在 Anthropic 警告 AI 变得过于危险并推动协调安全措施之后进行的。
Claude Fable 5 的初步印象
Anthropic 已发布 Claude Fable 5 和 Claude Mythos 5,两者均提供 100 万 token 的上下文窗口,价格则是 Opus 4.8 的两倍。Fable 5 配备了严格的安全护栏,而 Mythos 5 则没有。初步印象认为它是一款强大且能力出众的模型。
Claude Fable 5 和 Claude Mythos 5
Anthropic 推出了 Claude Fable 5,这是一款具有安全防护的最先进模型,同时还有用于网络防御的 Claude Mythos 5,两款模型的定价均低于之前的型号。
Claude Fable 5 基准测试
Anthropic 发布了 Claude Fable 5(一款新的人工智能模型)的基准测试,显示出显著的性能提升。