标签
作者分享了自己采用单一Codex智能体配合/goal模式的新编码工作流程的个人经历,他认为这比使用GPT-5.5和Opus 4.8等新模型的多智能体设置更优越。
Opus 4.8在MineBench 3D方块结构基准测试中相比Opus 4.7展现出更高的构建质量和更低的成本,尽管存在一些不一致性。该模型展示了更精简的推理过程和更高的推理效率。
Opus 4.8 现已可在 DeepSWE 上使用,得分比 Opus 4.7 高出6%,并降低了每任务平均成本。
Anthropic 估值达到 965 亿美元,超越 OpenAI,成为最有价值的 AI 创业公司,同日发布 Opus 4.8 模型。两家公司均在筹备 IPO,并争夺编码工具市场份额。
某用户批评 Anthropic 的 Opus 4.8 模型,将其与 Opus 4.6 相比称其较弱;另一用户附和,称该模型'愚蠢'。