@karpathy: 这是一个超激动人心的发布——Claude Fable 5 与 Mythos 使用相同的基础模型,但增加了安全措施。……

X AI KOLs 模型

摘要

Claude Fable 5 已发布,据称在各项基准测试中达到最先进水平,并在质量上有改进,尤其在复杂长任务上。它与 Mythos 使用相同的基础模型,但增加了安全措施。

这是一个超激动人心的发布——Claude Fable 5 与 Mythos 使用相同的基础模型,但增加了安全措施。基准测试结果很棒,它在各方面都领先,但我要补充的是,*在质量上*,这也是一个值得大版本提升的阶梯式进步(在我看来,其提升幅度与去年11月Claude 4.5的发布相当),尤其在解决非常困难问题的长时段编程会话中表现突出。你可以给它比你习惯的更雄心勃勃的任务,模型“理解”了,就会直接执行,从未如此让人想完全不再看代码(但别在生产环境这么做!)。模型仍有一些人们会遇到的小问题,并且安全措施在发布时设置得有点过于敏感,希望随着时间的推移能够调整。 我感觉到很多事物正在改变,因为可工作的软件越来越像打开水龙头一样轻易产出。杰文斯悖论开始显现,我感受到自己对软件的需求大幅增长。你可以要求任何东西——解释器、可视化工具、仪表盘、定制的单次使用应用(例如,一个完全针对你项目的超级具体的wandb),你可以将测试套件提升10倍、自动优化代码、运行大型研究项目并为其结果定制HTML,什么都可以!“解放你的思想”(《黑客帝国》梗)。非常期待人们将构建的一切!
查看原文
查看缓存全文

缓存时间: 2026/06/10 00:17

这是一个令人非常激动的发布——Claude Fable 5 与 Mythos 采用相同的底层模型,但增加了安全防护措施。各项基准测试表现优异,全面达到当前最优水平(SOTA)并拉开明显差距,但我还要补充一点:在质量层面(定性而言),这也是一个值得版本号大版本更新的阶梯式进步(在我看来,其提升幅度与去年11月的Claude 4.5相当),尤其是在处理极难问题的长时求解会话中,表现尤为突出。你可以给它设定比以往更有野心的任务,模型能“理解”你的意图并自主推进,让人几乎舍不得移开目光去检查代码(不过生产环境中还是别这么干!)。模型仍存在一些用户会遇到的小问题,并且当前的安全防护机制在发布时设置得稍显敏感,希望后续能通过调校逐步优化。

我感觉很多事情正在改变——可运行的软件越来越像自来水一样随取随用。杰文斯悖论正在发挥作用,我对软件的需求本身也在大幅增长。你可以要求任何东西:解释工具、可视化面板、仪表盘、定制化的单次使用应用(比如一个完全针对你项目的超具体wandb)、将你的测试套件扩展10倍、自动优化代码、运行大型研究项目并生成自定义HTML结果……什么都行!“解放你的思想”(《黑客帝国》梗)。非常期待大家即将创造的一切!

Claude (@claudeai): Fable 5 在几乎所有测试的基准上都达到了业界领先水平,在软件工程、知识工作、科学研究和视觉领域表现尤为卓越。

任务越长越复杂,Fable 5 相较于我们其他模型的领先优势就越大。

相似文章

Anthropic 发布首个 Mythos 级模型 Claude Fable

The Verge

Anthropic 宣布推出 Claude Fable 5,这是其迄今最强大的广泛可用 AI 模型,属于此前被认为过于危险而不得公开发布的 Mythos 系列。该模型引入了新的安全机制,在高风险领域会降级至 Opus 4.8。

Anthropic 的 Claude Fable 5 是公众今天可以访问的 Mythos 版本

TechCrunch AI

Anthropic 发布了 Claude Fable 5,这是其强大的 Mythos 模型的公开可访问版本,配备安全护栏,可阻止高风险领域的响应,并回退到较弱的模型。此次发布是在 Anthropic 警告 AI 变得过于危险并推动协调安全措施之后进行的。

Claude Fable 5 的初步印象

Simon Willison's Blog

Anthropic 已发布 Claude Fable 5 和 Claude Mythos 5,两者均提供 100 万 token 的上下文窗口,价格则是 Opus 4.8 的两倍。Fable 5 配备了严格的安全护栏,而 Mythos 5 则没有。初步印象认为它是一款强大且能力出众的模型。

Claude Fable 5 和 Claude Mythos 5

Anthropic News

Anthropic 推出了 Claude Fable 5,这是一款具有安全防护的最先进模型,同时还有用于网络防御的 Claude Mythos 5,两款模型的定价均低于之前的型号。

Claude Fable 5 基准测试

Reddit r/singularity

Anthropic 发布了 Claude Fable 5(一款新的人工智能模型)的基准测试,显示出显著的性能提升。