@0xSero: 有没有其他人注意到 opus-4.8 比刚推出时更差了?他们把它削弱了。
摘要
用户观察到 opus-4.8 模型自推出以来性能有所下降。
有没有其他人注意到 opus-4.8 比刚推出时更差了?
他们把它削弱了。https://t.co/7T6Ly7wpCq
查看缓存全文
缓存时间: 2026/05/29 07:38
有没有人注意到opus-4.8比以前刚发布时更差了?
他们削弱了它。https://t.co/7T6Ly7wpCq
相似文章
@jakevin7: A社也是终于有报应了,现在不用像之前那样费劲心机开 claude 了,还各种害怕被封号,因为没有必要了。 opus真的是越来越差了,之前觉得 opus 4.7表现已经很不如人意了。 opus4.8真的是差,是差到能明显感受出来的那种。 o…
用户抱怨Anthropic的Claude Opus模型质量持续下降,从4.7到4.8版本表现越来越差,考虑取消订阅。
@danshipper: 氛围测试:Opus 4.7 最近感觉进步很大。在编程、写作、策略和深度思考方面都有提升。
用户报告称,Opus 4.7 在编程、写作和策略推理任务上的表现有了显著改善。
Opus 4.7 在 SimpleBench 上得分低于 4.6 与 4.5
Claude Opus 4.7 在 SimpleBench 评估中的表现较 4.6 与 4.5 版本有所下降。
“@mfpiccolo: Opus 4.8 已发布。以下是 @iiidevs 首席工程师的结论:进行了压力测试,它只是另一个无法真正理解……的语言模型”
Anthropic 发布了 Claude Opus 4.8,这是对 Opus 4.7 的增量更新,具有更精准的判断力和更长的自主工作能力,不过一些工程师对其在缺乏广泛指导下的代码生成能力仍持怀疑态度。
@orca_build: Anthropic的新款Opus 4.8在Terminal-Bench 2.1上的得分比GPT 5.5低3.6%……但在UI任务上明显更出色。
Anthropic的Opus 4.8在Terminal-Bench 2.1上比GPT 5.5低3.6%,但擅长UI任务;Orca的编排功能让Codex能将UI任务委托给Claude Code。