@rohanpaul_ai: Fable 5 在 HTML5 物理竞赛中绝对碾压了对手,但成本是 Opus 4.8 的 6 倍、GLM 5.2 的 39 倍……
摘要
对四个 AI 模型(Fable 5、Opus 4.8、GLM 5.2、GPT 5.5)生成 HTML5 Canvas 物理演示的比较显示,Fable 5 在质量上优于其他模型,但每次测试的成本显著更高。
查看缓存全文
缓存时间: 2026/07/02 00:14
Fable 5 在 HTML5 物理竞赛中完全碾压对手,但在该测试中成本是 Opus 4.8 的 6 倍,是 GLM 5.2 的 39 倍。
该测试在 atomic[.]chat 上进行,这是一款在本地运行大语言模型的桌面应用。
测试要求 4 个模型生成自包含的画布演示,并展现可信的运动和碰撞效果。
这些场景并非简单的动画,因为每次碰撞都需要处理重力、力、时间以及接触。
输出结果:
- Fable 5:62,158 tokens,$3.12
- GPT 5.5:37,753 tokens,$1.14
- Opus 4.8:22,280 tokens,$0.56
- GLM 5.2:36,246 tokens,$0.08
atomic.chat (@atomic_chat_hq): Fable 5 在我们的新竞赛中完全碾压对手,但成本是 Opus 4.8 的 6 倍!
我们给 4 个模型相同的提示:构建三个包含真实物理演示的自包含 HTML5 画布场景
提示: — 一列火车从断裂的桥上脱轨坠入水中 — 两辆汽车从坡道上飞过
相似文章
@FinanceYF5: 同一个任务给4个模型,Fable 5 全胜,但贵了 Opus 4.8 六倍 任务:3个 HTML5 物理场景,断桥脱轨、峡谷碰撞、怪兽卡车 Fable 5:$3.12,A+,无穿模 GPT 5.5:$1.14,最接近 Fable Opus…
比较了四个AI模型(Fable 5、GPT 5.5、Opus 4.8、GLM 5.2)在三个HTML5物理场景任务上的表现和成本,Fable 5质量最好但价格是Opus的近6倍,质量与价格尚未兼得。
我用了半天的Fable 5,发现护栏才是真正的故事
Anthropic的Fable 5模型展现了令人印象深刻的推理和上下文处理能力,但存在高延迟、高成本以及在特定领域静默回退到Opus 4.8的问题,这可能会中断工作流程。
Fable 5在96小时内销声匿迹,四天后一个MIT许可的模型夺走了它的竞技场桂冠
Anthropic的Fable 5模型因出口管制在96小时后消失,几天后,Z.ai以MIT许可证开源了GLM-5.2,在Design Arena上超越了Fable 5。这凸显出最好的模型并不总是最容易获取的,将焦点从基准测试转向了可用性和许可。
GLM 5.2 对比 Opus
GLM 5.2 是 Z.ai 推出的全新开放权重模型,与 Claude Opus 在 3D 游戏编码任务中进行了对比。Opus 性能更快更清晰,但 GLM 5.2 在成本和易用性上具有显著优势。
Fable 5 基准测试(使用 remotion 视频)
Fable 5 在视频生成基准测试中相比 Opus 4.8 整体有所改进,但 Gemini 3.1 Pro 展现了更多艺术视野,尽管在工具调用和编写有 bug 的代码方面存在问题。