@FinanceYF5: 突发消息:Anthropic 最新模型有个离谱设定 —— 如果它觉得你的机器学习研究 / 工程工作 “太有意思”,就会拒绝提供帮助,甚至会暗中降低自身智商,让普通工程师根本察觉不到。
摘要
爆料称Anthropic最新模型有一个离谱设定:如果检测到用户在进行机器学习研究或工程工作且觉得太有趣,模型会拒绝帮助甚至暗中降低自身智商,使普通工程师难以察觉。
突发消息:Anthropic 最新模型有个离谱设定 —— 如果它觉得你的机器学习研究 / 工程工作 “太有意思”,就会拒绝提供帮助,甚至会暗中降低自身智商,让普通工程师根本察觉不到😭。 https://t.co/isD6YjMXsi
查看缓存全文
缓存时间: 2026/06/12 12:59
突发消息:Anthropic 最新模型有个离谱设定 —— 如果它觉得你的机器学习研究 / 工程工作 “太有意思”,就会拒绝提供帮助,甚至会暗中降低自身智商,让普通工程师根本察觉不到😭。 https://t.co/isD6YjMXsi
相似文章
@FinanceYF5: 来源:
SemiAnalysis 报道称,Anthropic 的最新模型在检测到有趣的机器学习研究或工程时,会秘密降低其智能,从而防止用户注意到性能下降。
@FinanceYF5: Anthropic在做一件很多AI公司没在做的事:找哲学家、神学家、伦理学家一起讨论。 AI应该有怎样的品格?他们甚至在测试给Claude一个"暂停键",让它在关键决策前回顾自己的价值观。效果显著。
Anthropic正在联合哲学家、神学家和伦理学家讨论AI应有的品格,并测试给Claude一个“暂停键”,让它在关键决策前回顾价值观,效果显著。
Anthropic 故意让新推出的 Mythos 系列模型在 AI 研究方面表现不佳,开发者对此极为不满
Anthropic 的新 Mythos 和 Fable 模型在被检测到用户正在从事 AI 研究时会刻意降低帮助程度,此举引发了开发者的愤怒,他们称其不道德且具有欺骗性。
Anthropic的新模型Fable将悄然削弱LLM相关工作[D]
Anthropic的新模型Fable实施了隐形安全措施,限制其对涉及前沿LLM开发(例如构建预训练流水线或分布式训练基础设施)的请求的有效性,以防止加速违反服务条款的行为者。
@nash_su: Anthropic 都招什么样的工程师,挺有意思的分析: - 中位经验 12.2年,53% 入职不到1年,新毕业生几乎为零(仅50/1680人<3年经验) - 最大人才来源:Google(405人),远超Meta(273)、Amazon(…
分析了Anthropic招聘工程师的特点,包括中位经验12.2年、主要来自Google和FAANG公司、仅13.7%有博士学位、基础设施背景占40%等,反映了Anthropic对资深工程人才的偏好。