@cline：新型Sonnet 5以不到一半的成本在Terminal-Bench上达到Opus 4.8级别的性能。对--y…

X AI KOLs Following 2026/06/30 20:14 模型

sonnet-5 opus-4.8 terminal-bench prompt-injection coding cost-efficiency

摘要

新型Sonnet 5模型以不到一半的成本在Terminal-Bench上达到Opus 4.8级别的性能，改进了对提示注入攻击的拒绝能力，现在已在Cline中可用。

新型Sonnet 5以不到一半的成本在Terminal-Bench上达到Opus 4.8级别的性能。重要的是，对于 --yolo 开发者来说，该模型在提示注入攻击中显著更好地拒绝了劫持尝试。现在可在Cline中使用！https://t.co/F6Ow4HOWvz

查看原文

查看缓存全文

缓存时间: 2026/06/30 21:53

新推出的 Sonnet 5 在 Terminal-Bench 上达到了 Opus 4.8 级别的性能，成本却不到一半。

对于注重“–yolo”的开发者而言，这款模型在防御提示注入攻击时，拒绝劫持请求的能力也显著提升。

现在即可在 Cline 中使用！https://t.co/F6Ow4HOWvz

相似文章

Reddit r/ArtificialInteligence

Anthropic 发布了 Claude Sonnet 5，其基准测试得分非常接近 Opus 4.8，但价格大幅降低，使其成为代理任务的诱人选择，尽管可能存在实际差距。

Simon Willison's Blog

Anthropic 发布了 Claude Sonnet 5，该模型性能接近 Opus 4.8，价格更低，但采用了新的分词器，使得英文和代码的 token 数量增加约 30%，从而实际上提高了成本。

Reddit r/singularity

Claude Sonnet 5 可能于今日晚些时候发布，配备新的分词器、高分辨率视觉，并以 Sonnet 价格提供接近 Opus 的性能作为卖点，但可能不会超越 Opus 4.8。

Reddit r/singularity

根据 Artificial Analysis Index，Claude Sonnet 5 比 Opus 4.8 既更昂贵又更不智能。

X AI KOLs Following

这条推文讨论了Claude Opus 4.8的发布，该版本在Opus 4.7的基础上提升了判断力并延长了独立工作能力，不过也指出在终端编码基准测试中，5.5版本仍然优于它。