@julien_c: 现在告诉我,Opus 4.7 到 Opus 4.8 的权重变化百分比是多少? <1%?
摘要
询问 Opus 4.7 和 Opus 4.8 之间的权重变化百分比。
现在告诉我
Opus 4.7 和 Opus 4.8 之间的权重变化百分比是多少?
<1%?
查看缓存全文
缓存时间: 2026/05/29 03:54
现在告诉我,Opus 4.7和Opus 4.8之间的权重变化百分比是多少?<1%?
相似文章
@0xSero: 有没有其他人注意到 opus-4.8 比刚推出时更差了?他们把它削弱了。
用户观察到 opus-4.8 模型自推出以来性能有所下降。
@datacurve: Opus 4.8 现已登陆 DeepSWE。在默认高思考投入设置下,其得分比 Opus 4.7 xhigh 高出6%,同时还能降低…
Opus 4.8 现已可在 DeepSWE 上使用,得分比 Opus 4.7 高出6%,并降低了每任务平均成本。
Opus 4.7 在 SimpleBench 上得分低于 4.6 与 4.5
Claude Opus 4.7 在 SimpleBench 评估中的表现较 4.6 与 4.5 版本有所下降。
@danshipper: 氛围测试:Opus 4.7 最近感觉进步很大。在编程、写作、策略和深度思考方面都有提升。
用户报告称,Opus 4.7 在编程、写作和策略推理任务上的表现有了显著改善。
MineBench上Opus 4.7与Opus 4.8的区别
Opus 4.8在MineBench 3D方块结构基准测试中相比Opus 4.7展现出更高的构建质量和更低的成本,尽管存在一些不一致性。该模型展示了更精简的推理过程和更高的推理效率。