@rohanpaul_ai: Fable 5 在 HTML5 物理竞赛中绝对碾压了对手,但成本是 Opus 4.8 的 6 倍、GLM 5.2 的 39 倍……

X AI KOLs Timeline 模型

摘要

对四个 AI 模型(Fable 5、Opus 4.8、GLM 5.2、GPT 5.5)生成 HTML5 Canvas 物理演示的比较显示,Fable 5 在质量上优于其他模型,但每次测试的成本显著更高。

Fable 5 在 HTML5 物理竞赛中绝对碾压了对手,但那次测试中其成本是 Opus 4.8 的 6 倍,是 GLM 5.2 的 39 倍。 测试在 atomic[.]chat 上进行,这是一款在本地运行 LLM 的桌面应用。 该测试要求 4 个模型生成自包含的 Canvas 演示,具有可信的运动和碰撞效果。 这些场景并非简单的动画,因为每次碰撞都需要处理重力、力、时机和接触。 输出: - Fable 5: 62,158 tokens, $3.12 - GPT 5.5: 37,753 tokens, $1.14 - Opus 4.8: 22,280 tokens, $0.56 - GLM 5.2: 36,246 tokens, $0.08
查看原文
查看缓存全文

缓存时间: 2026/07/02 00:14

Fable 5 在 HTML5 物理竞赛中完全碾压对手,但在该测试中成本是 Opus 4.8 的 6 倍,是 GLM 5.2 的 39 倍。

该测试在 atomic[.]chat 上进行,这是一款在本地运行大语言模型的桌面应用。

测试要求 4 个模型生成自包含的画布演示,并展现可信的运动和碰撞效果。

这些场景并非简单的动画,因为每次碰撞都需要处理重力、力、时间以及接触。

输出结果:

  • Fable 5:62,158 tokens,$3.12
  • GPT 5.5:37,753 tokens,$1.14
  • Opus 4.8:22,280 tokens,$0.56
  • GLM 5.2:36,246 tokens,$0.08

atomic.chat (@atomic_chat_hq): Fable 5 在我们的新竞赛中完全碾压对手,但成本是 Opus 4.8 的 6 倍!

我们给 4 个模型相同的提示:构建三个包含真实物理演示的自包含 HTML5 画布场景

提示: — 一列火车从断裂的桥上脱轨坠入水中 — 两辆汽车从坡道上飞过

相似文章

GLM 5.2 对比 Opus

Hacker News Top

GLM 5.2 是 Z.ai 推出的全新开放权重模型,与 Claude Opus 在 3D 游戏编码任务中进行了对比。Opus 性能更快更清晰,但 GLM 5.2 在成本和易用性上具有显著优势。

Fable 5 基准测试(使用 remotion 视频)

Reddit r/singularity

Fable 5 在视频生成基准测试中相比 Opus 4.8 整体有所改进,但 Gemini 3.1 Pro 展现了更多艺术视野,尽管在工具调用和编写有 bug 的代码方面存在问题。