@jun_song: 这怎么不算是消费者诈骗?这正是我们需要监管的领域。

X AI KOLs Timeline 新闻

摘要

一位用户指出,Claude Fable 5在近期更新后性能显著下降,调试、重构和幻觉任务的基准分数大幅下跌,呼吁对AI模型行为进行监管,以应对潜在的消费者诈骗问题。

这怎么不算是消费者诈骗? 这正是我们需要监管的领域。
查看原文
查看缓存全文

缓存时间: 2026/07/02 14:23

这怎么不算消费者诈骗呢?

这正是我们需要监管的领域。

BridgeMind (@bridgemindai): FABLE 5 回归后被削弱了。

我们在 BridgeBench 上重新运行了 7 月 1 日版本的 Claude Fable 5。

结果非常残酷:

调试:86.2 → 25.9 重构:73.6 → 38.4 幻觉:75.9 → 61.7

新的护栏机制在太多任务上生效,并回退到 Opus。

相似文章