@datacurve: Opus 4.8 现已登陆 DeepSWE。在默认高思考投入设置下,其得分比 Opus 4.7 xhigh 高出6%,同时还能降低…

X AI KOLs Following 模型

摘要

Opus 4.8 现已可在 DeepSWE 上使用,得分比 Opus 4.7 高出6%,并降低了每任务平均成本。

Opus 4.8 现已登陆 DeepSWE。 在默认高思考投入设置下,其得分比 Opus 4.7 xhigh 高出6%,同时还能降低每任务平均成本。https://t.co/HGLWsmDxZu
查看原文
查看缓存全文

缓存时间: 2026/05/31 16:53

Opus 4.8 现已登陆 DeepSWE。

在默认的高思考力度下,它的评分比 Opus 4.7 xhigh 高出 6%,同时平均每任务成本也有所降低。https://t.co/HGLWsmDxZu

相似文章

MineBench上Opus 4.7与Opus 4.8的区别

Reddit r/singularity

Opus 4.8在MineBench 3D方块结构基准测试中相比Opus 4.7展现出更高的构建质量和更低的成本,尽管存在一些不一致性。该模型展示了更精简的推理过程和更高的推理效率。