Fable 5在96小时内销声匿迹,四天后一个MIT许可的模型夺走了它的竞技场桂冠
摘要
Anthropic的Fable 5模型因出口管制在96小时后消失,几天后,Z.ai以MIT许可证开源了GLM-5.2,在Design Arena上超越了Fable 5。这凸显出最好的模型并不总是最容易获取的,将焦点从基准测试转向了可用性和许可。
我一直在将Fable 5到GLM-5.2的转变视为一个事件而非两个。6月9日,Anthropic发布了Fable 5,Mythos系列首次向公众开放,SWE-bench Verified达到95%,人们称其为有史以来最好的模型。6月12日,美国商务部发出了出口管制信函,到晚上该模型在全球范围内消失,包括美国公民也无法使用,因为Anthropic无法精确限制仅外国公民。总共96小时。四天后,6月16日,Z.ai以MIT许可证开源了GLM-5.2。Artificial Analysis Intelligence Index将其评分为51,在开放权重中排名第一,整体排名第四,仅次于已消失的Fable 5、Opus 4.8和GPT-5.5。在Design Arena上,它超过了Fable 5的分数。价格大约是GPT-5.5的六分之一。我觉得有趣的不是“中国赢了”或“开源赢了”,而是“最佳模型存在”与“你能实际使用的最佳模型”之间的差距现在成了一个动态变量。去年大部分时间,这个差距为零或接近零。排行榜顶端的模型就是你可以调用的模型。Fable 5在四天内打破了这一假设,而GLM-5.2故意填补了这个差距,采用MIT许可证,无地域限制,仿佛有人已经看清了局势。这改变了我看到新发布时的关注点。我以前首先看基准测试,现在我看可用性、许可、司法管辖风险,然后才是基准测试。技术能力在这一点上几乎是入场券,有趣的问题是谁能真正触及。对我而言,实际的做法是将提供商视为像云区域一样可能消失的东西。我通过GPTProto路由调用,这样当模型消失或许可变更时,回退只是一个配置开关,而不是需要周末重写。不是因为这样解决了依赖问题——并没有——而是因为它将“我的默认模型刚刚被出口管制”从一次事故变成了一个配置更改。我并不认为这意味着所有人都应该放弃闭源模型。Opus和GPT-5.5在许多工作负载上仍然明显更好。但“最佳模型总是可用的”这一假设不再是免费的。它是一个你正在选择的依赖,就像任何依赖一样,它可能会失效。
相似文章
Fable 5 Is Dead. And Honestly? We Might Be Better Off
美国政府迫使Anthropic在发布仅数天后撤下了其最强大的模型Fable 5。OpenRouter的新基准测试显示,融合的预算模型面板能以一半的成本达到或超过Fable 5的性能,引发了对前沿模型价值的质疑。
为什么 Fable 5 只包含到6月22日?Anthropic 真的认为这个模型太疯狂了吗?
Anthropic 的新模型,可能代号为 Fable 5,在主要 AI 基准测试中取得了尖端性能,在软件工程、长上下文任务中表现出色,并且仅提供到6月22日,引发了对其能力和局限性的疑问。
我用了半天的Fable 5,发现护栏才是真正的故事
Anthropic的Fable 5模型展现了令人印象深刻的推理和上下文处理能力,但存在高延迟、高成本以及在特定领域静默回退到Opus 4.8的问题,这可能会中断工作流程。
如何在一下午失去全球AI垄断地位 | 封禁Fable 5的真正影响
Anthropic在周五下午收到出口管制通知后,被迫在全球范围内关闭其先进AI模型Fable 5和Mythos 5,暴露出AI安全、国家安全与企业竞争之间的复杂紧张关系。
@TheAhmadOsman: GLM 5.2的数据使我相信我在自己的预测中过于保守了,最多两个月,我们就能在家玩到Fable 5
基于GLM 5.2的基准测试数据,预测开源AI模型将在两个月内与假想的Fable 5达到同等水平。