@karpathy: 这是一个超激动人心的发布——Claude Fable 5 与 Mythos 使用相同的基础模型，但增加了安全措施。……

X AI KOLs 2026/06/09 18:10 模型

claude-fable-5 model-release state-of-the-art benchmarks safeguards software-engineering ai-advancement

摘要

Claude Fable 5 已发布，据称在各项基准测试中达到最先进水平，并在质量上有改进，尤其在复杂长任务上。它与 Mythos 使用相同的基础模型，但增加了安全措施。

这是一个超激动人心的发布——Claude Fable 5 与 Mythos 使用相同的基础模型，但增加了安全措施。基准测试结果很棒，它在各方面都领先，但我要补充的是，*在质量上*，这也是一个值得大版本提升的阶梯式进步（在我看来，其提升幅度与去年11月Claude 4.5的发布相当），尤其在解决非常困难问题的长时段编程会话中表现突出。你可以给它比你习惯的更雄心勃勃的任务，模型“理解”了，就会直接执行，从未如此让人想完全不再看代码（但别在生产环境这么做！）。模型仍有一些人们会遇到的小问题，并且安全措施在发布时设置得有点过于敏感，希望随着时间的推移能够调整。我感觉到很多事物正在改变，因为可工作的软件越来越像打开水龙头一样轻易产出。杰文斯悖论开始显现，我感受到自己对软件的需求大幅增长。你可以要求任何东西——解释器、可视化工具、仪表盘、定制的单次使用应用（例如，一个完全针对你项目的超级具体的wandb），你可以将测试套件提升10倍、自动优化代码、运行大型研究项目并为其结果定制HTML，什么都可以！“解放你的思想”（《黑客帝国》梗）。非常期待人们将构建的一切！

查看原文

查看缓存全文

缓存时间: 2026/06/10 00:17

这是一个令人非常激动的发布——Claude Fable 5 与 Mythos 采用相同的底层模型，但增加了安全防护措施。各项基准测试表现优异，全面达到当前最优水平（SOTA）并拉开明显差距，但我还要补充一点：在质量层面（定性而言），这也是一个值得版本号大版本更新的阶梯式进步（在我看来，其提升幅度与去年11月的Claude 4.5相当），尤其是在处理极难问题的长时求解会话中，表现尤为突出。你可以给它设定比以往更有野心的任务，模型能“理解”你的意图并自主推进，让人几乎舍不得移开目光去检查代码（不过生产环境中还是别这么干！）。模型仍存在一些用户会遇到的小问题，并且当前的安全防护机制在发布时设置得稍显敏感，希望后续能通过调校逐步优化。

我感觉很多事情正在改变——可运行的软件越来越像自来水一样随取随用。杰文斯悖论正在发挥作用，我对软件的需求本身也在大幅增长。你可以要求任何东西：解释工具、可视化面板、仪表盘、定制化的单次使用应用（比如一个完全针对你项目的超具体wandb）、将你的测试套件扩展10倍、自动优化代码、运行大型研究项目并生成自定义HTML结果……什么都行！“解放你的思想”（《黑客帝国》梗）。非常期待大家即将创造的一切！

Claude (@claudeai): Fable 5 在几乎所有测试的基准上都达到了业界领先水平，在软件工程、知识工作、科学研究和视觉领域表现尤为卓越。

任务越长越复杂，Fable 5 相较于我们其他模型的领先优势就越大。

@karpathy: 这是一个超激动人心的发布——Claude Fable 5 与 Mythos 使用相同的基础模型，但增加了安全措施。……

相似文章

Anthropic 发布首个 Mythos 级模型 Claude Fable

Anthropic 的 Claude Fable 5 是公众今天可以访问的 Mythos 版本

Claude Fable 5 的初步印象

Claude Fable 5 和 Claude Mythos 5

Claude Fable 5 基准测试

提交意见反馈