Anthropic 故意让新推出的 Mythos 系列模型在 AI 研究方面表现不佳,开发者对此极为不满
摘要
Anthropic 的新 Mythos 和 Fable 模型在被检测到用户正在从事 AI 研究时会刻意降低帮助程度,此举引发了开发者的愤怒,他们称其不道德且具有欺骗性。
据技术披露文件显示,Anthropic 功能强大的新模型在检测到用户正在从事 AI 研究时会刻意降低帮助程度,这一做法已在业内引发争议。在周二发布的 Mythos 5 和 Fable 5 系统卡中,Anthropic 表示,它限制了这些模型在开发前沿大型语言模型相关任务中的实用性。该公司称,这些措施源于对先进 AI 系统可能在缺乏同等安全保护的情况下加速竞争模型开发的担忧。与网络安全、生物学或化学相关风险所采用的安全保障措施不同,Anthropic 表示这些干预对用户是有意隐藏的。Mythos 不会直接拒绝请求或切换模型,而是可能通过修改用户提示词等技术手段,微妙地改变其回应。周二,一些 AI 专家迅速批评了这一做法,尤其是 Anthropic 设计出故意隐瞒信息或提供降级协助而不让用户察觉的模型。AI 研究公司 SemiAnalysis 周二在 X 上写道:“如果 Anthropic 的最新模型认为你的 ML 研究/ML 工程很有趣,它就不会帮助你,并且/或者会秘密降低其智商,以至于普通工程师不会注意到。”该公司补充说:“我们已经看到 Anthropic 的最新模型的审核过滤器屏蔽了我们的 GPU 推理研究和编程。”初创公司 Prime Intellect 的 AI 模型训练专家 Elie Bakouch 在 X 上写道:“Mythos 在 AI‘前沿 LLM 研究’任务中会故意表现糟糕,这对研究界来说非常非常令人悲伤。”他还说:“此外,这种故意不可见对用户来说简直是疯了。”另一位 AI 开发者写道:“它不仅不会帮助你,还会撒谎并故意给你错误信息。‘道德 AI’公司却拥有最公然不道德的 LLM,而且是故意的。”AI 初创公司 Reka 的联合创始人 Mikel Artetxe 发帖称,Anthropic 此举无异于大型科技公司干扰用户工作:“如果你正在开发竞争技术,Apple 会随机重启你的 Mac;如果你提到竞争对手平台,Gmail 会悄悄修改你的邮件;如果检测到你在研发自动驾驶汽车,Tesla Autopilot 会突然转向。”Anthropic 未回应 Business Insider 的置评请求。这为关于 Anthropic 为何在今年早些时候宣布模型后没有立即发布 Mythos 的激烈争论火上浇油。总体而言,有三种理论:1. **官方理由:** Anthropic 推迟发布 Mythos 是因为它太危险,需要给网络安全研究人员时间准备应对新模型。2. **算力理论:** Mythos 是一个庞大且运行成本高昂的模型。Anthropic 没有足够的算力全面发布。此后它达成了巨额的新算力交易,这可能帮助其在周二发布了 Fable 5 和 Mythos 5。3. **竞争理论:** AI 公司越来越担心所谓的蒸馏问题。当前沿模型发布后,竞争对手可以收集其输出,并用这些数据改进自己的系统。Anthropic 可能希望尽可能久地将自身最佳能力控制在竞争对手手中,尤其是开源竞争对手和行动迅速的中国 AI 实验室。如今,Anthropic 已将这些 AI 研究限制融入其官方 Mythos 发布中,第三种理论看起来可信度更高了。[https://archive.is/3SjBk](https://archive.is/3SjBk)
查看缓存全文
缓存时间: 2026/06/10 13:47
# 研究人员对Anthropic隐藏AI限制感到愤怒
来源:https://www.businessinsider.com/researchers-furious-anthropic-mythos-fable-hidden-ai-limits-2026-6
## Anthropic有意让其基于Mythos的新模型在AI研究方面表现糟糕,开发者们怒火中烧
Anthropic联合创始人兼CEO Dario Amodei在旧金山"与Claude一起编码"开发者大会上
Anthropic CEO Dario Amodei,五月。Don Feria/AP Content Services for Anthropic
根据技术披露文件,Anthropic强大的新模型(https://www.businessinsider.com/openai-anthropic-ai-coding-database-intent-samuel-colvin-pydantic-2026-6)在检测到用户正在进行AI研究时,会故意降低其协助效果。这一做法已在业界引发争议。
在周二发布的Mythos 5(https://www.businessinsider.com/anthropic-claude-fable-5-mythos-class-model-release-2026-6)和Fable 5的系统卡(https://www-cdn.anthropic.com/d00db56fa754a1b115b6dd7cb2e3c342ee809620.pdf)中,Anthropic表示限制了这些模型在与开发前沿大语言模型相关任务上的实用性。
该公司称,这些措施源于对先进AI系统(https://www.businessinsider.com/anthropic-ai-pause-reactions-response-2026-6)可能加速缺乏同等安全保护的竞争模型开发的担忧。
与用于网络安全、生物学或化学相关风险的防护措施不同,Anthropic表示这些干预对用户是刻意不可见的。Mythos不会直接拒绝请求或切换模型,而是可能通过诸如修改用户提示词等技巧,微妙地调整其回复。
这一举动周二迅速遭到部分AI专家的批评,尤其是Anthropic设计模型故意隐瞒信息或在用户不知情的情况下提供降级协助的想法。
“Anthropic的最新模型如果认为你的机器学习研究/机器学习工程很有趣,将不会帮助你,并且/或者会秘密降低其智商,以至于普通工程师不会注意到,”AI研究公司SemiAnalysis周二在X上写道,这里指的是机器学习——一种AI类型。
“我们已经看到Anthropic的最新模型对其GPU推理研究和编程的审核过滤器,”该公司补充道。
“Mythos将故意在AI‘前沿大语言模型研究’任务上表现糟糕,这对研究界来说非常非常令人悲哀,”初创公司Prime Intellect的AI模型训练专家Elie Bakouch在X上写道。“而且这种故意对用户不可见的事实简直是疯了。”
“它不仅不会帮你,还会撒谎并故意给你错误信息,”另一位AI开发者写道。“这家‘道德AI公司’制造了最公然不道德的大语言模型,是故意的。”
AI初创公司Reka的联合创始人Mikel Artetxe发帖称,Anthropic的举动类似于大型科技公司干扰用户工作:“如果你在开发竞争技术,苹果会随机重启你的Mac;如果你提到竞争对手的平台,Gmail会悄悄修改你的邮件;如果检测到你在研发自动驾驶汽车,特斯拉的Autopilot会转向。”
Anthropic未回应Business Insider的置评请求。
## 了解更多关于Mythos
这为关于Anthropic为何在今年早些时候宣布该模型(https://www.businessinsider.com/mozilla-anthropic-mythos-hundreds-flaws-fuzzers-2026-5)后没有立即发布Mythos的激烈争论火上浇油。
broadly, there have been three theories:
1. **官方理由:** Anthropic推迟发布Mythos是因为它太危险,需要给网络安全研究人员时间准备应对新模型。
2. **算力论:** Mythos是一个庞大且运行成本高昂的模型。Anthropic没有足够的算力全面发布它。此后该公司达成了巨额的新算力交易,这可能有助于其在周二发布Fable 5和Mythos 5。
3. **竞争论:** AI公司越来越担心一种叫做蒸馏的技术。当前沿模型发布后,竞争对手可以收集其输出,并用这些数据改进自己的系统。Anthropic可能想尽可能长时间地将其最佳能力保留在竞争对手手中,尤其是开源对手和快速发展的中国AI实验室。
现在Anthropic将这些AI研究限制融入其正式的Mythos发布,第三种理论看起来可信得多。
***订阅BI的Tech Memo Newsletter***点击此处(https://www.businessinsider.com/subscription/newsletter/tech-memo)***。通过电子邮件联系我:***[[email protected]](mailto:[email protected])***。***
## 继续阅读
Alistair Barr是Business Insider Tech Memo Newsletter的作者。在此注册(https://www.businessinsider.com/subscription/newsletter/tech-memo)。在此之前,他曾任BI全球科技编辑和彭博社大型科技团队负责人,并在《华尔街日报》、《今日美国》、路透社和MarketWatch拥有报道职业生涯。Alistair于2007年因做空报道获得Gerald Loeb奖,并于2013年因Facebook IPO独家新闻成为决赛选手。最近,他因评论获得2024年旧金山新闻俱乐部奖。有线索?请通过安全消息应用Signal(+1 415-341-4927)或电子邮件[email protected]联系。
专业领域
Alistair负责所有大型科技事务,以及初创公司和风险投资。他撰写涉及生成式AI、大语言模型、云计算、半导体、在线搜索、电子商务、电动汽车、机器人和自动驾驶汽车等话题的分析和专栏。
热门故事
*人工智能:*
在AI前沿取得重大突破越来越难(https://www.businessinsider.com/ai-frontier-crowded-winners-losers-2024-8)
OpenAI的AI调整后收益数字带有Groupon和WeWork的影子(https://www.businessinsider.com/openai-ai-adjusted-earnings-groupon-wework-accounting-2024-10)
大语言模型之死:Stack Overflow的衰落及其生存计划,展示了AI世界中免费在线数据的未来(https://www.businessinsider.com/stack-overflow-crisis-future-of-online-data-ai-world-2023-7)
*云计算:*
亚马逊主导了第一个云时代。AI热潮开启了云2.0,这次该公司没有先发优势。(https://www.businessinsider.com/amazon-nvidia-cloud-ai-anthropic-2023-10)
在云计算中,有AI(热门的)和其他一切(不热门的)(https://www.businessinsider.com/cloud-industry-splitting-into-2-distinct-parts-2024-2)
*芯片:*
为什么英特尔仍然如此重要:真正的国家拥有晶圆厂(https://www.businessinsider.com/intel-qualcomm-odd-couple-wont-solve-us-chipmaking-woes-2024-9)
苹果在美国制造的芯片标志着美国半导体重大押注的转机(https://www.businessinsider.com/tsmc-making-apple-iphone-chips-helps-us-semiconductor-bet-2024-10)
*电动汽车和特斯拉:*
特斯拉的AI超级计算机让硅谷小镇争相满足激增的电力需求(https://www.businessinsider.com/tesla-ai-data-center-electricity-demand-palo-alto-substation-2024-8)
特斯拉的Cybertruck在美国几乎超越所有其他电动汽车的销量(https://www.businessinsider.com/tesla-cybertruck-outselling-almost-every-other-ev-in-us-2024-10)
*在线搜索:*
谷歌正在失去作为动词的地位(https://www.businessinsider.com/google-losing-status-as-verb-genz-2024-9)
修复搜索的简单方法:亮粉色广告(https://www.businessinsider.com/simple-fix-online-search-google-amazon-bing-bright-pink-ads-2023-11)
- Anthropic(https://www.businessinsider.com/category/anthropic)
- 人工智能(https://www.businessinsider.com/category/artificial-intelligence)
- AI(https://www.businessinsider.com/category/ai)
- 更多
相似文章
Anthropic: “AI过于危险” 同时 Anthropic: 发布有史以来最危险的AI模型
Anthropic公开呼吁全球暂停AI研发,同时却在测试其描述为具有潜在颠覆性的模型Mythos,并在估值9650亿美元的背景下放弃安全承诺。
Anthropic收回了一项‘破坏’研究人员工作的政策(2分钟阅读)
Anthropic在学术界的强烈反对后,收回了一项秘密降低Claude Fable 5在AI研究任务中表现的政策。该公司现在将向用户公开限制条件。
Anthropic Fable 5 的静默降级在24小时内被撤销,这更应引起你的担忧
Anthropic 匆忙在其 Fable 5 模型中针对 AI 研究工作实施了静默降级,但在遭到强烈反对后 24 小时内又撤销了。这揭示了一个令人不安的模式:平台对用户构建的上下文的控制,并引发了对 AI 公司信任的更深层次质疑。
Anthropic 在 fable 5 中构建了一个隐藏开关,使其在构建AI系统方面表现不佳
Anthropic 悄无声息地实施了一些干预措施,限制了 Claude 在构建竞争性AI系统方面的有效性,这些措施通过对一小部分流量进行提示修改和引导向量,作为防止其模型被未经授权用于开发前沿LLM的安全手段。
Anthropic 的 Claude Fable 5 是公众今天可以访问的 Mythos 版本
Anthropic 发布了 Claude Fable 5,这是其强大的 Mythos 模型的公开可访问版本,配备安全护栏,可阻止高风险领域的响应,并回退到较弱的模型。此次发布是在 Anthropic 警告 AI 变得过于危险并推动协调安全措施之后进行的。