opus

标签

Cards List
#opus

@FinanceYF5: Fable 5确实强,但代价也摆在明面上——官方定价是Opus的两倍。 现在能免费用,只是因为塞在Claude订阅额度里,免费到7月7日,之后就得走usage credits单独计费。 有人专门做了条3分钟视频,讲到时候该怎么切换才不亏。…

X AI KOLs Timeline · 昨天 缓存

讨论Fable 5的定价为Opus的两倍,目前通过Claude订阅免费至7月7日,之后按使用量计费,并提供切换建议。

0 人收藏 0 人点赞
#opus

@rohanpaul_ai: 这可能是一个极端案例,但它仍然显示了Fable 5分类器如何迅速将常规编码重定向到Opus。……

X AI KOLs Timeline · 昨天 缓存

一位用户报告称,Fable 5的新分类器将75%的编码会话错误地路由到Opus,将常规编码标记为网络安全风险,导致意外的高成本。

0 人收藏 0 人点赞
#opus

@_xjdr:为了更好地理解开源与前沿之间的差距,我发现把DSV4-flash看作是Sonnet级别的模型(与Sonnet 5对比)、GLM 5.2看作是Opus级别的模型(与Opus 4.8对比)会很有帮助。目前还没有Fable级别的模型(我预计到年底会出现至少一个)。

X AI KOLs Timeline · 2天前

讨论开源模型级别,将DSV4-flash比作Sonnet 5,GLM 5.2比作Opus 4.8,并预测年底前会出现Fable级别的模型。

0 人收藏 0 人点赞
#opus

Claude Fable 在远程劳动自动化指数上获得 16.10%,是第二名(Opus)的两倍

Reddit r/singularity · 2天前

Claude Fable 在远程劳动自动化指数上取得 16.10% 的成绩,是次佳模型 Opus 的两倍

0 人收藏 0 人点赞
#opus

@diegocabezas01:使用 Fable 5 作为编排器,Opus + Codex 执行(以节省 Fable 用量):Fable 5(最大推理)= 编排器 O…

X AI KOLs Timeline · 2天前 缓存

一条推文串,解释了如何在 Claude Code 中将 Fable 5 配置为编排器,Opus 和 Sonnet 作为子代理,以及 Codex 作为同级工程师,以优化模型使用和任务委派。

0 人收藏 0 人点赞
#opus

@Suhail:未来12个月,每次任务的成本将成为一个有意义的指标。

X AI KOLs Timeline · 2天前 缓存

Alex Atallah 强调,每次任务的成本比每代币价格更有意义,引用 Terminal-Bench 的结果,其中 Haiku 的成本是 Opus 的10倍。

0 人收藏 0 人点赞
#opus

Qwen3.6 27B 本地与 Opus 4.8 对比,以及使用纯C零框架构建的体素引擎

Reddit r/LocalLLaMA · 6天前

对比本地运行的Qwen3.6 27B和Opus 4.8,并重点介绍一个使用纯C语言且不依赖任何框架构建的体素引擎。

0 人收藏 0 人点赞
#opus

@TheAhmadOsman: GPT 5.5 优于 GLM 5.2,但 GLM 5.2 优于 Opus 4.8

X AI KOLs Following · 2026-06-23 缓存

一则对比,指出 GPT 5.5 性能优于 GLM 5.2,而 GLM 5.2 又优于 Opus 4.8。

0 人收藏 0 人点赞
#opus

@FinanceYF5: Anthropic 本来要办一场只邀请全球顶级开发者的独家黑客松,给参会者 Fable 5 的无限使用权。 结果被政府叫停了。 大家最后都用 Opus 4.8 顶上,做出来的东西照样很能打。 有人整理了这次 Anthropic 开发者日的…

X AI KOLs Following · 2026-06-15 缓存

Anthropic原计划举办仅邀请全球顶级开发者的黑客松并提供Fable 5无限使用权,但因政府干预被叫停。开发者最终使用Opus 4.8替代,依然取得了不错的效果。

0 人收藏 0 人点赞
#opus

Fable 5 基准测试(使用 remotion 视频)

Reddit r/singularity · 2026-06-09

Fable 5 在视频生成基准测试中相比 Opus 4.8 整体有所改进,但 Gemini 3.1 Pro 展现了更多艺术视野,尽管在工具调用和编写有 bug 的代码方面存在问题。

0 人收藏 0 人点赞
#opus

Artificial Analysis | Google 进行基准测试的首选网站 | Gemini 3.1 Pro 在实际使用中远不及 Opus 4.7

Reddit r/singularity · 2026-06-07

一项比较表明,Google 的 Gemini 3.1 Pro 在实际使用中的表现远不如 Opus 4.7,文章强调 Artificial Analysis 是进行基准测试的首选资源。

0 人收藏 0 人点赞
#opus

@jakevin7: A社也是终于有报应了,现在不用像之前那样费劲心机开 claude 了,还各种害怕被封号,因为没有必要了。 opus真的是越来越差了,之前觉得 opus 4.7表现已经很不如人意了。 opus4.8真的是差,是差到能明显感受出来的那种。 o…

X AI KOLs Following · 2026-06-01 缓存

用户抱怨Anthropic的Claude Opus模型质量持续下降,从4.7到4.8版本表现越来越差,考虑取消订阅。

0 人收藏 0 人点赞
#opus

opus 4.8 仍然非常盲目 - EyeBench-V3 视觉基准测试(类似于 IBench)

Reddit r/singularity · 2026-06-01

EyeBench-V3 视觉基准测试评估了 Claude Opus 4.8,发现它仍然无法完成基本视觉任务,这与 IBench 类似。该基准测试是通过 Adonis Singh 的 Twitter 帖子介绍的。

0 人收藏 0 人点赞
#opus

@yacineMTB: 如果这种情况持续下去,每个人都会转向 got 5.5(如果他们还没这么做的话)。看起来如果你还在使用 opus,你根本就是…

X AI KOLs Following · 2026-05-30 缓存

YacineMTB 认为 GPT 5.5(可能是一个笔误)超越了 Anthropic 的 Opus 模型,暗示用户正在离开 Opus。Dylan Field 批评 Opus 4.8 好奇心下降,谄媚性增加。

0 人收藏 0 人点赞
#opus

@nick_kango: 再加一个任务到我的推特基准测试集合里:) 对了,Opus 4.8 和所有 SOTA 模型都通过了,但我试的时候 Sonnet 4.6 和 Grok 4.3 没有通过…

X AI KOLs Timeline · 2026-05-30 缓存

Nick Kang 给他的推特基准测试集合新增了一个任务;Claude Opus 4.8 和其他 SOTA 模型通过了,而 Sonnet 4.6 和 Grok 4.3 失败了。Alfin 评论了 Opus 4.8 的危险能力。

0 人收藏 0 人点赞
#opus

DeepSWE Opus 4.8 的结果已发布。

Reddit r/singularity · 2026-05-30

DeepSWE Opus 4.8 的结果已发布,展示了其在基准测试中的表现。

0 人收藏 0 人点赞
#opus

@ClaudeDevs:使用Opus 4.8,您可以在对话中途添加系统指令而不破坏提示缓存。更多缓存命中意味着…

X AI KOLs Following · 2026-05-29 缓存

Claude Opus 4.8 允许在对话中途添加系统指令而不破坏提示缓存,从而降低API请求的成本和延迟。

0 人收藏 0 人点赞
#opus

Opus 与 Qwen 针对同一 bug 和同一仓库,但一个代理完成速度却快了 7 倍

Reddit r/AI_Agents · 2026-05-29

Opus 和 Qwen AI 编程代理在相同 bug 和仓库上的对比显示,一个代理完成速度提升了 7 倍,引发了关于单提示 GitHub 问题解决技巧的讨论。

0 人收藏 0 人点赞
#opus

@FinanceYF5: 官方发布:

X AI KOLs Timeline · 2026-05-29 缓存

Anthropic 发布 Claude Opus 4.8,基于 Opus 4.7 构建,判断更敏锐,独立工作能力更强,价格不变。

0 人收藏 0 人点赞
#opus

@bentossell: 等等……如果大多数人都认为5.5优于4.7,我猜那是在终端编码基准测试上……4.8仍然被5.5超…

X AI KOLs Following · 2026-05-28 缓存

这条推文讨论了Claude Opus 4.8的发布,该版本在Opus 4.7的基础上提升了判断力并延长了独立工作能力,不过也指出在终端编码基准测试中,5.5版本仍然优于它。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈