Fable 5在96小时内销声匿迹,四天后一个MIT许可的模型夺走了它的竞技场桂冠

Reddit r/singularity 新闻

摘要

Anthropic的Fable 5模型因出口管制在96小时后消失,几天后,Z.ai以MIT许可证开源了GLM-5.2,在Design Arena上超越了Fable 5。这凸显出最好的模型并不总是最容易获取的,将焦点从基准测试转向了可用性和许可。

我一直在将Fable 5到GLM-5.2的转变视为一个事件而非两个。6月9日,Anthropic发布了Fable 5,Mythos系列首次向公众开放,SWE-bench Verified达到95%,人们称其为有史以来最好的模型。6月12日,美国商务部发出了出口管制信函,到晚上该模型在全球范围内消失,包括美国公民也无法使用,因为Anthropic无法精确限制仅外国公民。总共96小时。四天后,6月16日,Z.ai以MIT许可证开源了GLM-5.2。Artificial Analysis Intelligence Index将其评分为51,在开放权重中排名第一,整体排名第四,仅次于已消失的Fable 5、Opus 4.8和GPT-5.5。在Design Arena上,它超过了Fable 5的分数。价格大约是GPT-5.5的六分之一。我觉得有趣的不是“中国赢了”或“开源赢了”,而是“最佳模型存在”与“你能实际使用的最佳模型”之间的差距现在成了一个动态变量。去年大部分时间,这个差距为零或接近零。排行榜顶端的模型就是你可以调用的模型。Fable 5在四天内打破了这一假设,而GLM-5.2故意填补了这个差距,采用MIT许可证,无地域限制,仿佛有人已经看清了局势。这改变了我看到新发布时的关注点。我以前首先看基准测试,现在我看可用性、许可、司法管辖风险,然后才是基准测试。技术能力在这一点上几乎是入场券,有趣的问题是谁能真正触及。对我而言,实际的做法是将提供商视为像云区域一样可能消失的东西。我通过GPTProto路由调用,这样当模型消失或许可变更时,回退只是一个配置开关,而不是需要周末重写。不是因为这样解决了依赖问题——并没有——而是因为它将“我的默认模型刚刚被出口管制”从一次事故变成了一个配置更改。我并不认为这意味着所有人都应该放弃闭源模型。Opus和GPT-5.5在许多工作负载上仍然明显更好。但“最佳模型总是可用的”这一假设不再是免费的。它是一个你正在选择的依赖,就像任何依赖一样,它可能会失效。
查看原文

相似文章

Fable 5 Is Dead. And Honestly? We Might Be Better Off

Reddit r/openclaw

美国政府迫使Anthropic在发布仅数天后撤下了其最强大的模型Fable 5。OpenRouter的新基准测试显示,融合的预算模型面板能以一半的成本达到或超过Fable 5的性能,引发了对前沿模型价值的质疑。