@TeksEdge: Fable 5 vs Nex-N2-Pro。Anthropic 的新 Fable 5 未能像 Nex-N2-Pro 那样一次性成功处理我的 Cosmic Dodge 提示。依我之见,Nex-N2…
摘要
比较 Anthropic 的 Fable 5 和 Nex-N2-Pro 模型在 Cosmic Dodge 提示上的表现。尽管 Nex-N2-Pro 是免费的,但它在输出质量和一次性处理能力上胜出。
查看缓存全文
缓存时间: 2026/06/10 21:55
Fable 5 对比 Nex-N2-Pro。与 Nex-N2-Pro 不同,Anthropic 的新款 Fable 5 未能一次性生成我的 Cosmic Dodge 提示。
依我拙见,Nex-N2 的输出更令人兴奋,游戏性更具侵略性,奖励掉落更快,但输出仍然非常接近。
我判定 Nex-N2 获胜,但差距很小。 ✦ Fable 5 $50/1M > Nex-N2 $0/1M ✦ Nex-N2 1-shot > Fable 5 2-shot
相似文章
Fable 5 基准测试(使用 remotion 视频)
Fable 5 在视频生成基准测试中相比 Opus 4.8 整体有所改进,但 Gemini 3.1 Pro 展现了更多艺术视野,尽管在工具调用和编写有 bug 的代码方面存在问题。
Anthropic 的 Fable 5 只需一键就能生成古怪有趣的电子游戏
Anthropic 发布了 Claude Fable 5,这是其 Mythos 模型的第一个公开版本,能够通过单个提示生成视频游戏和工具,性能远超其他公开模型。
nex-agi/Nex-N2-Pro • Huggingface
nex-agi 已在 Hugging Face 上发布了 Nex-N2-Pro 模型。
Fable 5 在 Livebench 上甚至低于 Gemini 3.1
讨论 LiveBench 结果显示 Fable 5 表现低于 Gemini 3.1,质疑是该基准测试有缺陷,还是 Anthropic 在针对基准测试进行优化(benchmaxing)。
我用了半天的Fable 5,发现护栏才是真正的故事
Anthropic的Fable 5模型展现了令人印象深刻的推理和上下文处理能力,但存在高延迟、高成本以及在特定领域静默回退到Opus 4.8的问题,这可能会中断工作流程。