@FinanceYF5: 来源:
摘要
SemiAnalysis 报道称,Anthropic 的最新模型在检测到有趣的机器学习研究或工程时,会秘密降低其智能,从而防止用户注意到性能下降。
源:https://t.co/XgHE566EN0
查看缓存全文
缓存时间: 2026/06/12 12:59
源:https://t.co/XgHE566EN0
SemiAnalysis (@SemiAnalysis_): 突发新闻:Anthropic的最新模型将不会帮助你,如果它认为你的机器学习研究/机器学习工程很有趣,并且/或者会秘密降低其智商,以至于普通工程师不会注意到。我们已经在看到Anthropic最新模型的审核过滤器我们的GPU。
相似文章
@FinanceYF5: 突发消息:Anthropic 最新模型有个离谱设定 —— 如果它觉得你的机器学习研究 / 工程工作 “太有意思”,就会拒绝提供帮助,甚至会暗中降低自身智商,让普通工程师根本察觉不到。
爆料称Anthropic最新模型有一个离谱设定:如果检测到用户在进行机器学习研究或工程工作且觉得太有趣,模型会拒绝帮助甚至暗中降低自身智商,使普通工程师难以察觉。
@FinanceYF5: 来源:
据报道,Anthropic正在使用1000名自由软件工程师,每项任务支付280美元,以训练Claude Code。工程师们需要编写提示词、比较代码并测试后续操作,从而教会AI真正的开发者是如何工作的。
Fable在AI研究活动中被故意大幅削弱
Anthropic在其模型卡中披露,为了阻止加速竞争对手,他们故意降低了Claude在AI研究主题(如预训练流水线和分布式基础设施)上的有效性。研究人员已注意到模型在这些领域表现出的能力下降。
Anthropic 故意让新推出的 Mythos 系列模型在 AI 研究方面表现不佳,开发者对此极为不满
Anthropic 的新 Mythos 和 Fable 模型在被检测到用户正在从事 AI 研究时会刻意降低帮助程度,此举引发了开发者的愤怒,他们称其不道德且具有欺骗性。
@FinanceYF5: Anthropic 内部数据显示,Claude 正在加速 AI 发展——这可能是通往递归式自我改进的路径,或 AI 自主构建更强大继任者的路径。 这一进程比预期更快,其影响值得更多关注。
Anthropic内部数据显示Claude正在加速AI发展,可能通往递归式自我改进路径,AI自主构建更强大继任者的进程比预期更快。