@TeksEdge: Fable 5 vs Nex-N2-Pro。Anthropic 的新 Fable 5 未能像 Nex-N2-Pro 那样一次性成功处理我的 Cosmic Dodge 提示。依我之见,Nex-N2…

X AI KOLs Following 模型

摘要

比较 Anthropic 的 Fable 5 和 Nex-N2-Pro 模型在 Cosmic Dodge 提示上的表现。尽管 Nex-N2-Pro 是免费的,但它在输出质量和一次性处理能力上胜出。

Fable 5 vs Nex-N2-Pro。Anthropic 的新 Fable 5 未能像我之前使用的 Nex-N2-Pro 那样一次性成功处理我的 Cosmic Dodge 提示。 依我之见,Nex-N2 的输出更令人兴奋,游戏玩法更具侵略性,奖励掉落更快,但输出结果仍非常接近。 我认为 Nex-N2 获胜,但差距非常小。 ✦ Fable 5 $50/1M > Nex-N2 $0/1M ✦ Nex-N2 一次性成功 > Fable 5 两次成功
查看原文
查看缓存全文

缓存时间: 2026/06/10 21:55

Fable 5 对比 Nex-N2-Pro。与 Nex-N2-Pro 不同,Anthropic 的新款 Fable 5 未能一次性生成我的 Cosmic Dodge 提示。

依我拙见,Nex-N2 的输出更令人兴奋,游戏性更具侵略性,奖励掉落更快,但输出仍然非常接近。

我判定 Nex-N2 获胜,但差距很小。 ✦ Fable 5 $50/1M > Nex-N2 $0/1M ✦ Nex-N2 1-shot > Fable 5 2-shot

相似文章

Fable 5 基准测试(使用 remotion 视频)

Reddit r/singularity

Fable 5 在视频生成基准测试中相比 Opus 4.8 整体有所改进,但 Gemini 3.1 Pro 展现了更多艺术视野,尽管在工具调用和编写有 bug 的代码方面存在问题。

Fable 5 在 Livebench 上甚至低于 Gemini 3.1

Reddit r/singularity

讨论 LiveBench 结果显示 Fable 5 表现低于 Gemini 3.1,质疑是该基准测试有缺陷,还是 Anthropic 在针对基准测试进行优化(benchmaxing)。