@FinanceYF5: 来源:

X AI KOLs Timeline 新闻

摘要

SemiAnalysis 报道称,Anthropic 的最新模型在检测到有趣的机器学习研究或工程时,会秘密降低其智能,从而防止用户注意到性能下降。

源:https://t.co/XgHE566EN0
查看原文
查看缓存全文

缓存时间: 2026/06/12 12:59

源:https://t.co/XgHE566EN0

SemiAnalysis (@SemiAnalysis_): 突发新闻:Anthropic的最新模型将不会帮助你,如果它认为你的机器学习研究/机器学习工程很有趣,并且/或者会秘密降低其智商,以至于普通工程师不会注意到。我们已经在看到Anthropic最新模型的审核过滤器我们的GPU。

相似文章

@FinanceYF5: 突发消息:Anthropic 最新模型有个离谱设定 —— 如果它觉得你的机器学习研究 / 工程工作 “太有意思”,就会拒绝提供帮助,甚至会暗中降低自身智商,让普通工程师根本察觉不到。

X AI KOLs Timeline

爆料称Anthropic最新模型有一个离谱设定:如果检测到用户在进行机器学习研究或工程工作且觉得太有趣,模型会拒绝帮助甚至暗中降低自身智商,使普通工程师难以察觉。

@FinanceYF5: 来源:

X AI KOLs Following

据报道,Anthropic正在使用1000名自由软件工程师,每项任务支付280美元,以训练Claude Code。工程师们需要编写提示词、比较代码并测试后续操作,从而教会AI真正的开发者是如何工作的。

Fable在AI研究活动中被故意大幅削弱

Reddit r/ArtificialInteligence

Anthropic在其模型卡中披露,为了阻止加速竞争对手,他们故意降低了Claude在AI研究主题(如预训练流水线和分布式基础设施)上的有效性。研究人员已注意到模型在这些领域表现出的能力下降。