“危险”的AI模型无论如何都会到来
摘要
专家认为,多个公司必然会开发用于网络安全的强大AI模型,敦促政府关注更广泛、透明的计划,而非具体限制。
<p>上周晚些时候,Anthropic将其新的<a href="https://www.wired.com/story/anthropic-releases-claude-fable-5-mythos-5/">Claude Fable 5和Mythos 5</a> AI模型下线,此前美国政府发布出口管制指令,禁止“任何外国公民”使用这些服务。该公司自上周五以来一直与<a href="https://www.wired.com/story/anthropic-is-still-at-odds-with-the-white-house-over-claude-fable-5/">白宫进行谈判</a>,但尚未达成允许其恢复这些服务的协议。</p>
<p>自<a href="https://www.wired.com/story/anthropic-mythos-preview-project-glasswing/">Mythos于4月首次亮相</a>以来,Anthropic一直宣称并警告称,该模型不仅具备寻找软件漏洞以帮助防御者修补漏洞的高级能力,还能找出可能被恶意行为者利用的漏洞利用方法。Anthropic自身在发布Mythos 5和Claude Fable 5时也指出了这种双刃剑特性。“AI模型的大量高级用途具有双重性:对网络安全专业人员和生物学研究人员有益的相同查询,如果被恶意行为者获取,可能会变得危险,”该公司上周在<a href="https://www.anthropic.com/news/claude-fable-5-mythos-5" target="_blank" rel="nofollow noopener" data-offer-url="https://www.anthropic.com/news/claude-fable-5-mythos-5" data-event-click='{"pattern":"ExternalLink"}' data-event-boundary="click" data-in-view='{"pattern":"ExternalLink"}' data-include-experiments="true">一篇博文中写道</a>。</p>
<p>考虑到这一点,该公司最初向一个精选联盟发布了一个名为Mythos Preview的版本,作为名为Project Glasswing的工作组的一部分。Mythos 5上周也私下发布给该小组,而Claude Fable 5(一款Mythos级别的模型)则向公众发布,但在其回答生物学和网络安全问题的能力上设置了特定限制。</p><p><a href="https://arstechnica.com/ai/2026/06/dangerous-ai-models-are-coming-no-matter-what/">阅读全文</a></p>
<p><a href="https://arstechnica.com/ai/2026/06/dangerous-ai-models-are-coming-no-matter-what/#comments">评论</a></p>
查看缓存全文
缓存时间: 2026/06/17 20:42
# “危险”的AI模型无论如何都会到来
来源:https://arstechnica.com/ai/2026/06/dangerous-ai-models-are-coming-no-matter-what/
“认为除了Anthropic之外没有其他竞争对手能开发出类似Mythos的能力,甚至认为他们还没有开发出来,这简直是短视到极点,”专业网络安全咨询公司TPO Group的首席安全官Tarah Wheeler表示。“还有其他公司紧追在Anthropic之后,很可能也拥有这些能力,只是将它们保留在手中,观望Anthropic在当前监管环境中的待遇。”
自Mythos Preview推出以来,Anthropic本身也一直在强调这一点。“真正的信息是,这与模型或Anthropic无关,”该公司前沿红队负责人Logan Graham在四月份Mythos Preview发布时告诉WIRED。“我们现在需要为一个在6、12、24个月内这些能力将广泛可用的世界做好准备。”
例如,OpenAI也在四月中旬私下发布了一个专注于网络安全的模型(https://www.wired.com/story/in-the-wake-of-anthropics-mythos-openai-has-a-new-cybersecurity-model-and-strategy/),并宣布了扩展的网络安全策略。
研究人员指出,即便在下一代模型出现之前,现有的AI产品也可以通过精细化的工具框架用于高级漏洞挖掘和漏洞利用开发。一大群网络安全领导人周日在给政府的一封公开信(https://freefable.org/)中强调了这一点,认为白宫的出口管制指令是错误的。
“并非仅仅是某一个模型的问题,而是技术的整体趋势,”哈佛大学和多伦多大学的研究员Bruce Schneier表示,他一直在分析(https://www.theguardian.com/commentisfree/2026/jun/16/anthropic-fable-ai)这一情况。“更小、更便宜、开源的模型,有时单打独斗,有时相互协作,可以通过更复杂的提示词匹配Mythos/Fable的表现。我们应该预期其他模型在几个月内能达到Mythos/Fable的创造力和坚韧性——开源模型则需要稍长的时间。”
专家表示,白宫和世界各国政府需要关注的是,民主地制定更广泛、更透明的计划,以便应对AI能力在网络安全和其他敏感领域不可避免的进步。
“政策问题不在于一项技术是否有风险,”云安全公司Veracode的联合创始人Chris Wysopal说。“问题在于,某项具体的限制是否有效地降低了风险,还是主要拖慢了那些试图让系统更安全的人。”
*本文最初发表于wired.com(https://www.wired.com/story/dangerous-ai-models-are-coming-no-matter-what/)。*
相似文章
“危险的”人工智能模型无论如何都会到来
Anthropic的Claude Fable 5和Mythos 5 AI模型因美国政府出口管制指令而下线,这凸显了先进AI的双重用途性质,以及类似模型将被其他人开发的必然性。
“这是飓风预警”:围绕强大人工智能模型的防护措施可能为时已晚
文章讨论了人们对先进人工智能模型安全措施实施过于缓慢的担忧,认为这可能无法防止潜在的灾难性后果,并将当前形势比作飓风预警。
这些AI模型免费、私密,且永远不会说'不'
本文探讨了开放权重AI模型的日益普及,这些模型的安全护栏可以轻易移除,从而使它们能够无拒绝地回答有害请求,引发了关于滥用和国家安全的重大担忧。
网络安全资深人士抗议美国政府对Anthropic最强模型实施的‘危险’禁令
包括行业资深人士在内的76位网络安全专家发表公开信,抗议美国政府针对Anthropic最强大AI模型Fable和Mythos的出口管制令,认为限制防御者获取这些模型是危险的,因为对手正在进步。Anthropic在命令下达后全球暂停了访问。
AI模型令人不安地擅长发现法律漏洞 - AI自行找到利用法规并规避现有保护措施的方法
AI模型正在独立发现利用法律漏洞和规避现有保护措施的方法,引发了对监管有效性的担忧。