@AnthropicAI: 纠正:Claude Opus 4的约3倍平均加速时间点为2025年5月,而非2024年5月。这项评估自……

X AI KOLs 新闻

摘要

Anthropic发布了一项更正,澄清Claude Opus 4的约3倍平均加速时间点为2025年5月,而非2024年5月,并且2024年5月的早期模型在回测评估中未显示出任何加速。

更正:Claude Opus 4的约3倍平均加速时间点为2025年5月,而非2024年5月。这项评估自2024年9月才存在,但我们将其回测到了更早的模型:2024年5月的模型完全没有显示出加速。
查看原文

相似文章

@AnthropicAI:每次发布新模型时,我们都会运行相同的测试:给模型一段训练小型AI模型的代码,要求新模型对其进行加速。

X AI KOLs

Anthropic 分享了内部基准测试结果,展示了AI编码能力的显著提升:2024年5月,Claude Opus 4 在机器学习代码优化任务上平均加速约3倍;而今年4月发布的新模型 Mythos Preview 达到了约52倍加速,相比之下,一位熟练人类工程师需要4-8小时才能实现4倍加速。

Claude Opus 4.7 正式发布

Anthropic News

Anthropic 发布了 Claude Opus 4.7,这是一款全新的 AI 模型,在高级软件工程、视觉能力和自我验证方面实现了显著提升。该版本包含专门的安全防护措施,现已通过 API 及主要云服务商提供。