标签
Anthropic的Claude Opus 4.8更新大幅减少了自信但错误的答案,在报告有缺陷的结果上得分为0%,并提供了一个提示词来利用这一改进进行关键的自我批判。
本文认为,最危险的AI失败并非源于错误答案,而是系统基于不完整的数据、过时的上下文或糟糕的假设,以虚假自信行事。这表明AI评估应优先考虑处理不确定性的能力,而非原始智能。