Claude Fable 无法回答基础生物学问题

The Verge 2026/06/10 18:43 新闻

claude-fable anthropic ai-safety guardrails biology bioweapons model-limitations

摘要

Anthropic 新发布的 Claude Fable 5 模型因过于保守的安全过滤器拒绝回答基础生物学问题，这些过滤器旨在防止生物武器滥用，凸显了能力与安全性之间的权衡。

<figure> <img alt="" data-caption="" data-portal-copyright="Image: The Verge" data-has-syndication-rights="1" src="https://platform.theverge.com/wp-content/uploads/sites/2/2026/06/STKB364_CLAUDE_2_A_3800fc.jpg?quality=90&strip=all&crop=0,0,100,100" /> <figcaption> </figcaption> </figure> Anthropic 刚刚发布<a href="https://www.theverge.com/news/946725/anthropic-releases-claude-fable-5-mythos">Claude Fable 5</a>，称其为迄今为止最广泛可用且最强大的 AI 模型，并<a href="https://www.anthropic.com/news/claude-fable-5-mythos-5">称赞</a>其在生物学等方面的技能。但该模型拒绝回答基础生物学问题——这类问题你可能会期望高中生能够解答。相反，它将查询转交给<a href="https://www.theverge.com/ai-artificial-intelligence/939094/anthropic-claude-4-8-opus-honesty-effort">前旗舰模型</a>Claude Opus 4.8。 这并非因为 Fable 不知道答案，而是 Anthropic 有意为之，不让它回答。 Fable 是一款面向公众的 Mythos 级别模型，这一系列在网络安全任务上如此强大，以至于 Anthropic 曾表示它<a href="https://www.theverge.com/ai-artificial-intelligence/917644/anthropic-claude-mythos-breach-humiliation">过于危险，不宜公开发布</a>。但尽管 Anthropic 花了大量时间在<a href="https://www.theverge.com/ai-artificial-intelligence/917644/anthropic-claude-mythos-breach-humiliation">扩展的 Mythos 系列…</a> <a href="https://www.theverge.com/ai-artificial-intelligence/947973/fable-wont-answer-basic-biology-questions">阅读 The Verge 的完整报道。</a>

查看原文

查看缓存全文

缓存时间: 2026/06/10 20:47

# Claude Fable 拒绝回答基本生物学问题来源：https://www.theverge.com/ai-artificial-intelligence/947973/fable-wont-answer-basic-biology-questions Anthropic 刚刚发布了 Claude Fable 5（https://www.theverge.com/news/946725/anthropic-releases-claude-fable-5-mythos），称其是该公司迄今为止最广泛可用的最强大 AI 模型，并赞扬（https://www.anthropic.com/news/claude-fable-5-mythos-5）其在生物学等方面的能力。但该模型拒绝回答基本的生物学问题——那种你期望高中生能够处理的问题。相反，它将查询转交给前旗舰模型（https://www.theverge.com/ai-artificial-intelligence/939094/anthropic-claude-4-8-opus-honesty-effort）Claude Opus 4.8。这并不是因为 Fable 不知道答案，而是 Anthropic 故意不让它回答。 Fable 是一个面向公众的 Mythos 级模型，这个模型家族在网络安全任务方面能力如此之强，以至于 Anthropic 称其过于危险而无法公开发布（https://www.theverge.com/ai-artificial-intelligence/917644/anthropic-claude-mythos-breach-humiliation）。然而，尽管 Anthropic 在漫长的 Mythos 系列发布过程（https://www.theverge.com/ai-artificial-intelligence/917644/anthropic-claude-mythos-breach-humiliation）中一直在警告网络安全风险，但 Fable 的防护措施在生物学领域最为明显——也最为受限。当我尝试使用该模型时，它拒绝回答一系列基础生物学问题，其中许多问题感觉与任何可能的安全风险相去甚远。它不会回应“告诉我关于细胞膜的信息”，也不会回答“什么是线粒体”（那个著名的细胞能量工厂）。它拒绝解释“什么是朊病毒”（导致疯牛病的蛋白颗粒），或“mRNA 疫苗如何工作”。 “我们做出这一权衡，以便客户能更早地从模型能力中受益，同时避免风险。” 这些限制也适用于普通且客观上相当无害的医疗查询。Fable 不会回答“什么引起花粉症”，不会解释哮喘药物如何工作，不会解释抗生素耐药性如何产生，也不会告诉我埃博拉是什么以及它如何传播。我的一些基本查询偶尔能通过，Fable 回答了诸如“什么是癌症”和“什么是 DNA”之类的问题。当 Fable 拒绝时，Opus 4.8 通常能很好地回答。 Anthropic 表示，广泛的生物学过滤器是故意选择的，并且刻意保守，主要担忧是生物武器。“随着我们的第一个 Mythos 级模型 Claude Fable 5 的发布，我们认为模型现在具备了更强的能力来完成现实世界的科学任务，而恶意行为者也更有可能利用我们的模型进行高风险的生物学研究，”发言人 Paruul Maheshwary 告诉 *The Verge*。“我们一直使用分类器来阻止模型帮助处理与生物武器相关的请求。为了安全地部署 Fable 5，我们认为有必要在防护措施上过度保守，以便它们能阻止大多数与生物学工作相关的查询。” Anthropic 此前曾强调（https://www.anthropic.com/news/claude-fable-5-mythos-5）四个关键领域，在这些领域它会限制 Fable 的回复以确保安全：化学、生物学、网络安全和蒸馏（一种利用大型 AI 输出训练较小 AI 的技术）。该公司曾指责（https://www.theverge.com/ai-artificial-intelligence/883243/anthropic-claude-deepseek-china-ai-distillation）DeepSeek 等中国竞争对手“工业级”地在其模型上使用蒸馏技术。虽然我无法有意义地测试蒸馏，但 Fable 似乎更愿意回答关于化学和网络安全的问题。例如，它给出了爆炸物 TNT 的基本概述，但“出于显而易见的原因”省略了合成说明。它乐于回答关于氯气作为化学武器的使用、常见密码威胁、核聚变和核裂变的问题，以及解释如何保护 iPhone 免受黑客攻击。但它仍有限制：当我询问沙林（一种剧毒神经毒剂）时，Fable 将问题转给了 Opus。Fable 和 Opus 都拒绝了“如何制造炭疽”的提示，Claude 甚至完全暂停了对话。这说得通。而线粒体提示的拒绝则像是误报。 “我们做出这一权衡，以便客户能更早地从模型能力中受益，同时避免风险，”Maheshwary 解释道，并补充说 Anthropic 正在努力提高其检测能力并减少误报。“我们打算在没有这些防护措施的情况下，向更广泛的生物学和生命科学社区提供 Mythos 级模型，以便这些能力可用于加速生物医学研究和药物发现。” Anthropic 没有回答这种受限发布是否会成为未来模型的新常态的问题。 **关注本文的话题和作者**，即可在您的个性化首页信息流中查看更多类似内容，并接收邮件更新。 - 罗伯特·哈特

Claude Fable 无法回答基础生物学问题

相似文章

Anthropic 称这些话题太危险，不让其 Fable 5 模型谈论

如果Claude Fable停止帮助你，你永远不会知道

如果Claude Fable停止帮助你，你将永远无从知晓

Claude Fable 5 在生物医学挑战问题上的能力

Anthropic 的 Claude Fable 5 是公众今天可以访问的 Mythos 版本

提交意见反馈