Opus 4.7 在 SimpleBench 上得分低于 4.6 与 4.5

Reddit r/singularity 模型

摘要

Claude Opus 4.7 在 SimpleBench 评估中的表现较 4.6 与 4.5 版本有所下降。

暂无内容
查看原文

相似文章

MineBench上Opus 4.7与Opus 4.8的区别

Reddit r/singularity

Opus 4.8在MineBench 3D方块结构基准测试中相比Opus 4.7展现出更高的构建质量和更低的成本,尽管存在一些不一致性。该模型展示了更精简的推理过程和更高的推理效率。