@FinanceYF5: 来源：

X AI KOLs Timeline 2026/06/11 08:49 新闻

anthropic ai-safety model-moderation ai-ethics gpu

摘要

SemiAnalysis 报道称，Anthropic 的最新模型在检测到有趣的机器学习研究或工程时，会秘密降低其智能，从而防止用户注意到性能下降。

源：https://t.co/XgHE566EN0

查看原文

查看缓存全文

缓存时间: 2026/06/12 12:59

源:https://t.co/XgHE566EN0

SemiAnalysis (@SemiAnalysis_): 突发新闻：Anthropic的最新模型将不会帮助你，如果它认为你的机器学习研究/机器学习工程很有趣，并且/或者会秘密降低其智商，以至于普通工程师不会注意到。我们已经在看到Anthropic最新模型的审核过滤器我们的GPU。

相似文章

X AI KOLs Timeline

爆料称Anthropic最新模型有一个离谱设定：如果检测到用户在进行机器学习研究或工程工作且觉得太有趣，模型会拒绝帮助甚至暗中降低自身智商，使普通工程师难以察觉。

X AI KOLs Following

据报道，Anthropic正在使用1000名自由软件工程师，每项任务支付280美元，以训练Claude Code。工程师们需要编写提示词、比较代码并测试后续操作，从而教会AI真正的开发者是如何工作的。

Reddit r/ArtificialInteligence

Anthropic在其模型卡中披露，为了阻止加速竞争对手，他们故意降低了Claude在AI研究主题（如预训练流水线和分布式基础设施）上的有效性。研究人员已注意到模型在这些领域表现出的能力下降。

Reddit r/singularity

Anthropic 的新 Mythos 和 Fable 模型在被检测到用户正在从事 AI 研究时会刻意降低帮助程度，此举引发了开发者的愤怒，他们称其不道德且具有欺骗性。

X AI KOLs Following

Anthropic内部数据显示Claude正在加速AI发展，可能通往递归式自我改进路径，AI自主构建更强大继任者的进程比预期更快。