opus

#opus

@FinanceYF5: Fable 5确实强，但代价也摆在明面上——官方定价是Opus的两倍。现在能免费用，只是因为塞在Claude订阅额度里，免费到7月7日，之后就得走usage credits单独计费。有人专门做了条3分钟视频，讲到时候该怎么切换才不亏。…

X AI KOLs Timeline ↗ · 昨天缓存

讨论Fable 5的定价为Opus的两倍，目前通过Claude订阅免费至7月7日，之后按使用量计费，并提供切换建议。

0 人收藏 0 人点赞

#opus

@rohanpaul_ai: 这可能是一个极端案例，但它仍然显示了Fable 5分类器如何迅速将常规编码重定向到Opus。……

X AI KOLs Timeline ↗ · 昨天缓存

一位用户报告称，Fable 5的新分类器将75%的编码会话错误地路由到Opus，将常规编码标记为网络安全风险，导致意外的高成本。

0 人收藏 0 人点赞

#opus

@_xjdr：为了更好地理解开源与前沿之间的差距，我发现把DSV4-flash看作是Sonnet级别的模型（与Sonnet 5对比）、GLM 5.2看作是Opus级别的模型（与Opus 4.8对比）会很有帮助。目前还没有Fable级别的模型（我预计到年底会出现至少一个）。

X AI KOLs Timeline ↗ · 2天前

讨论开源模型级别，将DSV4-flash比作Sonnet 5，GLM 5.2比作Opus 4.8，并预测年底前会出现Fable级别的模型。

0 人收藏 0 人点赞

#opus

Claude Fable 在远程劳动自动化指数上获得 16.10%，是第二名（Opus）的两倍

Reddit r/singularity ↗ · 2天前

Claude Fable 在远程劳动自动化指数上取得 16.10% 的成绩，是次佳模型 Opus 的两倍

0 人收藏 0 人点赞

#opus

@diegocabezas01：使用 Fable 5 作为编排器，Opus + Codex 执行（以节省 Fable 用量）：Fable 5（最大推理）= 编排器 O…

X AI KOLs Timeline ↗ · 2天前缓存

一条推文串，解释了如何在 Claude Code 中将 Fable 5 配置为编排器，Opus 和 Sonnet 作为子代理，以及 Codex 作为同级工程师，以优化模型使用和任务委派。

0 人收藏 0 人点赞

#opus

@Suhail：未来12个月，每次任务的成本将成为一个有意义的指标。

X AI KOLs Timeline ↗ · 2天前缓存

Alex Atallah 强调，每次任务的成本比每代币价格更有意义，引用 Terminal-Bench 的结果，其中 Haiku 的成本是 Opus 的10倍。

0 人收藏 0 人点赞

#opus

Qwen3.6 27B 本地与 Opus 4.8 对比，以及使用纯C零框架构建的体素引擎

Reddit r/LocalLLaMA ↗ · 6天前

对比本地运行的Qwen3.6 27B和Opus 4.8，并重点介绍一个使用纯C语言且不依赖任何框架构建的体素引擎。

0 人收藏 0 人点赞

#opus

@TheAhmadOsman: GPT 5.5 优于 GLM 5.2，但 GLM 5.2 优于 Opus 4.8

X AI KOLs Following ↗ · 2026-06-23 缓存

一则对比，指出 GPT 5.5 性能优于 GLM 5.2，而 GLM 5.2 又优于 Opus 4.8。

0 人收藏 0 人点赞

#opus

@FinanceYF5: Anthropic 本来要办一场只邀请全球顶级开发者的独家黑客松，给参会者 Fable 5 的无限使用权。结果被政府叫停了。大家最后都用 Opus 4.8 顶上，做出来的东西照样很能打。有人整理了这次 Anthropic 开发者日的…

X AI KOLs Following ↗ · 2026-06-15 缓存

Anthropic原计划举办仅邀请全球顶级开发者的黑客松并提供Fable 5无限使用权，但因政府干预被叫停。开发者最终使用Opus 4.8替代，依然取得了不错的效果。

0 人收藏 0 人点赞

#opus

Fable 5 基准测试（使用 remotion 视频）

Reddit r/singularity ↗ · 2026-06-09

Fable 5 在视频生成基准测试中相比 Opus 4.8 整体有所改进，但 Gemini 3.1 Pro 展现了更多艺术视野，尽管在工具调用和编写有 bug 的代码方面存在问题。

0 人收藏 0 人点赞

#opus

Artificial Analysis | Google 进行基准测试的首选网站 | Gemini 3.1 Pro 在实际使用中远不及 Opus 4.7

Reddit r/singularity ↗ · 2026-06-07

一项比较表明，Google 的 Gemini 3.1 Pro 在实际使用中的表现远不如 Opus 4.7，文章强调 Artificial Analysis 是进行基准测试的首选资源。

0 人收藏 0 人点赞

#opus

@jakevin7: A社也是终于有报应了，现在不用像之前那样费劲心机开 claude 了，还各种害怕被封号，因为没有必要了。 opus真的是越来越差了，之前觉得 opus 4.7表现已经很不如人意了。 opus4.8真的是差，是差到能明显感受出来的那种。 o…

X AI KOLs Following ↗ · 2026-06-01 缓存

用户抱怨Anthropic的Claude Opus模型质量持续下降，从4.7到4.8版本表现越来越差，考虑取消订阅。

0 人收藏 0 人点赞

#opus

opus 4.8 仍然非常盲目 - EyeBench-V3 视觉基准测试（类似于 IBench）

Reddit r/singularity ↗ · 2026-06-01

EyeBench-V3 视觉基准测试评估了 Claude Opus 4.8，发现它仍然无法完成基本视觉任务，这与 IBench 类似。该基准测试是通过 Adonis Singh 的 Twitter 帖子介绍的。

0 人收藏 0 人点赞

#opus

@yacineMTB: 如果这种情况持续下去，每个人都会转向 got 5.5（如果他们还没这么做的话）。看起来如果你还在使用 opus，你根本就是…

X AI KOLs Following ↗ · 2026-05-30 缓存

YacineMTB 认为 GPT 5.5（可能是一个笔误）超越了 Anthropic 的 Opus 模型，暗示用户正在离开 Opus。Dylan Field 批评 Opus 4.8 好奇心下降，谄媚性增加。

0 人收藏 0 人点赞

#opus

@nick_kango: 再加一个任务到我的推特基准测试集合里:) 对了，Opus 4.8 和所有 SOTA 模型都通过了，但我试的时候 Sonnet 4.6 和 Grok 4.3 没有通过…

X AI KOLs Timeline ↗ · 2026-05-30 缓存

Nick Kang 给他的推特基准测试集合新增了一个任务；Claude Opus 4.8 和其他 SOTA 模型通过了，而 Sonnet 4.6 和 Grok 4.3 失败了。Alfin 评论了 Opus 4.8 的危险能力。

0 人收藏 0 人点赞

#opus

DeepSWE Opus 4.8 的结果已发布。

Reddit r/singularity ↗ · 2026-05-30

DeepSWE Opus 4.8 的结果已发布，展示了其在基准测试中的表现。

0 人收藏 0 人点赞

#opus

@ClaudeDevs：使用Opus 4.8，您可以在对话中途添加系统指令而不破坏提示缓存。更多缓存命中意味着…

X AI KOLs Following ↗ · 2026-05-29 缓存

Claude Opus 4.8 允许在对话中途添加系统指令而不破坏提示缓存，从而降低API请求的成本和延迟。

0 人收藏 0 人点赞

#opus

Opus 与 Qwen 针对同一 bug 和同一仓库，但一个代理完成速度却快了 7 倍

Reddit r/AI_Agents ↗ · 2026-05-29

Opus 和 Qwen AI 编程代理在相同 bug 和仓库上的对比显示，一个代理完成速度提升了 7 倍，引发了关于单提示 GitHub 问题解决技巧的讨论。

0 人收藏 0 人点赞

#opus

@FinanceYF5: 官方发布：

X AI KOLs Timeline ↗ · 2026-05-29 缓存

Anthropic 发布 Claude Opus 4.8，基于 Opus 4.7 构建，判断更敏锐，独立工作能力更强，价格不变。

0 人收藏 0 人点赞

#opus

@bentossell: 等等……如果大多数人都认为5.5优于4.7，我猜那是在终端编码基准测试上……4.8仍然被5.5超…

X AI KOLs Following ↗ · 2026-05-28 缓存

这条推文讨论了Claude Opus 4.8的发布，该版本在Opus 4.7的基础上提升了判断力并延长了独立工作能力，不过也指出在终端编码基准测试中，5.5版本仍然优于它。

0 人收藏 0 人点赞

opus

提交意见反馈