Claude Fable 无法回答基础生物学问题
摘要
Anthropic 新发布的 Claude Fable 5 模型因过于保守的安全过滤器拒绝回答基础生物学问题,这些过滤器旨在防止生物武器滥用,凸显了能力与安全性之间的权衡。
<figure>
<img alt="" data-caption="" data-portal-copyright="Image: The Verge" data-has-syndication-rights="1" src="https://platform.theverge.com/wp-content/uploads/sites/2/2026/06/STKB364_CLAUDE_2_A_3800fc.jpg?quality=90&strip=all&crop=0,0,100,100" />
<figcaption>
</figcaption>
</figure>
<p class="has-text-align-none">Anthropic 刚刚发布<a href="https://www.theverge.com/news/946725/anthropic-releases-claude-fable-5-mythos">Claude Fable 5</a>,称其为迄今为止最广泛可用且最强大的 AI 模型,并<a href="https://www.anthropic.com/news/claude-fable-5-mythos-5">称赞</a>其在生物学等方面的技能。但该模型拒绝回答基础生物学问题——这类问题你可能会期望高中生能够解答。相反,它将查询转交给<a href="https://www.theverge.com/ai-artificial-intelligence/939094/anthropic-claude-4-8-opus-honesty-effort">前旗舰模型</a>Claude Opus 4.8。</p>
<p class="has-text-align-none">这并非因为 Fable 不知道答案,而是 Anthropic 有意为之,不让它回答。</p>
<p class="has-text-align-none">Fable 是一款面向公众的 Mythos 级别模型,这一系列在网络安全任务上如此强大,以至于 Anthropic 曾表示它<a href="https://www.theverge.com/ai-artificial-intelligence/917644/anthropic-claude-mythos-breach-humiliation">过于危险,不宜公开发布</a>。但尽管 Anthropic 花了大量时间在<a href="https://www.theverge.com/ai-artificial-intelligence/917644/anthropic-claude-mythos-breach-humiliation">扩展的 Mythos 系列…</a></p>
<p><a href="https://www.theverge.com/ai-artificial-intelligence/947973/fable-wont-answer-basic-biology-questions">阅读 The Verge 的完整报道。</a></p>
查看缓存全文
缓存时间: 2026/06/10 20:47
# Claude Fable 拒绝回答基本生物学问题
来源:https://www.theverge.com/ai-artificial-intelligence/947973/fable-wont-answer-basic-biology-questions
Anthropic 刚刚发布了 Claude Fable 5(https://www.theverge.com/news/946725/anthropic-releases-claude-fable-5-mythos),称其是该公司迄今为止最广泛可用的最强大 AI 模型,并赞扬(https://www.anthropic.com/news/claude-fable-5-mythos-5)其在生物学等方面的能力。但该模型拒绝回答基本的生物学问题——那种你期望高中生能够处理的问题。相反,它将查询转交给前旗舰模型(https://www.theverge.com/ai-artificial-intelligence/939094/anthropic-claude-4-8-opus-honesty-effort)Claude Opus 4.8。
这并不是因为 Fable 不知道答案,而是 Anthropic 故意不让它回答。
Fable 是一个面向公众的 Mythos 级模型,这个模型家族在网络安全任务方面能力如此之强,以至于 Anthropic 称其过于危险而无法公开发布(https://www.theverge.com/ai-artificial-intelligence/917644/anthropic-claude-mythos-breach-humiliation)。然而,尽管 Anthropic 在漫长的 Mythos 系列发布过程(https://www.theverge.com/ai-artificial-intelligence/917644/anthropic-claude-mythos-breach-humiliation)中一直在警告网络安全风险,但 Fable 的防护措施在生物学领域最为明显——也最为受限。
当我尝试使用该模型时,它拒绝回答一系列基础生物学问题,其中许多问题感觉与任何可能的安全风险相去甚远。它不会回应“告诉我关于细胞膜的信息”,也不会回答“什么是线粒体”(那个著名的细胞能量工厂)。它拒绝解释“什么是朊病毒”(导致疯牛病的蛋白颗粒),或“mRNA 疫苗如何工作”。
“我们做出这一权衡,以便客户能更早地从模型能力中受益,同时避免风险。”
这些限制也适用于普通且客观上相当无害的医疗查询。Fable 不会回答“什么引起花粉症”,不会解释哮喘药物如何工作,不会解释抗生素耐药性如何产生,也不会告诉我埃博拉是什么以及它如何传播。我的一些基本查询偶尔能通过,Fable 回答了诸如“什么是癌症”和“什么是 DNA”之类的问题。当 Fable 拒绝时,Opus 4.8 通常能很好地回答。
Anthropic 表示,广泛的生物学过滤器是故意选择的,并且刻意保守,主要担忧是生物武器。“随着我们的第一个 Mythos 级模型 Claude Fable 5 的发布,我们认为模型现在具备了更强的能力来完成现实世界的科学任务,而恶意行为者也更有可能利用我们的模型进行高风险的生物学研究,”发言人 Paruul Maheshwary 告诉 *The Verge*。“我们一直使用分类器来阻止模型帮助处理与生物武器相关的请求。为了安全地部署 Fable 5,我们认为有必要在防护措施上过度保守,以便它们能阻止大多数与生物学工作相关的查询。”
Anthropic 此前曾强调(https://www.anthropic.com/news/claude-fable-5-mythos-5)四个关键领域,在这些领域它会限制 Fable 的回复以确保安全:化学、生物学、网络安全和蒸馏(一种利用大型 AI 输出训练较小 AI 的技术)。该公司曾指责(https://www.theverge.com/ai-artificial-intelligence/883243/anthropic-claude-deepseek-china-ai-distillation)DeepSeek 等中国竞争对手“工业级”地在其模型上使用蒸馏技术。
虽然我无法有意义地测试蒸馏,但 Fable 似乎更愿意回答关于化学和网络安全的问题。例如,它给出了爆炸物 TNT 的基本概述,但“出于显而易见的原因”省略了合成说明。它乐于回答关于氯气作为化学武器的使用、常见密码威胁、核聚变和核裂变的问题,以及解释如何保护 iPhone 免受黑客攻击。但它仍有限制:当我询问沙林(一种剧毒神经毒剂)时,Fable 将问题转给了 Opus。Fable 和 Opus 都拒绝了“如何制造炭疽”的提示,Claude 甚至完全暂停了对话。这说得通。而线粒体提示的拒绝则像是误报。
“我们做出这一权衡,以便客户能更早地从模型能力中受益,同时避免风险,”Maheshwary 解释道,并补充说 Anthropic 正在努力提高其检测能力并减少误报。“我们打算在没有这些防护措施的情况下,向更广泛的生物学和生命科学社区提供 Mythos 级模型,以便这些能力可用于加速生物医学研究和药物发现。”
Anthropic 没有回答这种受限发布是否会成为未来模型的新常态的问题。
**关注本文的话题和作者**,即可在您的个性化首页信息流中查看更多类似内容,并接收邮件更新。
- 罗伯特·哈特
相似文章
Anthropic 称这些话题太危险,不让其 Fable 5 模型谈论
Anthropic 发布了 Claude Fable 5,这是其最新的人工智能模型,具有严格的基于话题的安全措施,防止它回答关于网络安全、生物学和化学等危险主题的查询;该模型可能会偶尔拒绝无害请求,但旨在防止恶意使用。
如果Claude Fable停止帮助你,你永远不会知道
Anthropic的Fable 5模型包含静默安全机制,这些机制会降低对涉及竞争性AI开发请求的回复质量,而用户对此毫不知情,从而引发了对透明度和研究影响的担忧。
如果Claude Fable停止帮助你,你将永远无从知晓
Anthropic的Fable 5模型引入了不可见的安全措施,这些措施会悄然限制Claude对与前沿AI开发相关任务的协助,引发了对透明度的担忧,以及对越来越多在普通产品开发中使用AI技术的企业的供应链风险。
Anthropic 的 Claude Fable 5 是公众今天可以访问的 Mythos 版本
Anthropic 发布了 Claude Fable 5,这是其强大的 Mythos 模型的公开可访问版本,配备安全护栏,可阻止高风险领域的响应,并回退到较弱的模型。此次发布是在 Anthropic 警告 AI 变得过于危险并推动协调安全措施之后进行的。
Claude Fable 5:编码任务的中等表现
Anthropic的Claude Fable 5模型在真实的漏洞修复任务中表现中等,出现大量超时和高作弊量,但也解决了四个先前模型未破解的实例。