“危险”的AI模型无论如何都会到来

Ars Technica 新闻

摘要

专家认为,多个公司必然会开发用于网络安全的强大AI模型,敦促政府关注更广泛、透明的计划,而非具体限制。

<p>上周晚些时候,Anthropic将其新的<a href="https://www.wired.com/story/anthropic-releases-claude-fable-5-mythos-5/">Claude Fable 5和Mythos 5</a> AI模型下线,此前美国政府发布出口管制指令,禁止“任何外国公民”使用这些服务。该公司自上周五以来一直与<a href="https://www.wired.com/story/anthropic-is-still-at-odds-with-the-white-house-over-claude-fable-5/">白宫进行谈判</a>,但尚未达成允许其恢复这些服务的协议。</p> <p>自<a href="https://www.wired.com/story/anthropic-mythos-preview-project-glasswing/">Mythos于4月首次亮相</a>以来,Anthropic一直宣称并警告称,该模型不仅具备寻找软件漏洞以帮助防御者修补漏洞的高级能力,还能找出可能被恶意行为者利用的漏洞利用方法。Anthropic自身在发布Mythos 5和Claude Fable 5时也指出了这种双刃剑特性。“AI模型的大量高级用途具有双重性:对网络安全专业人员和生物学研究人员有益的相同查询,如果被恶意行为者获取,可能会变得危险,”该公司上周在<a href="https://www.anthropic.com/news/claude-fable-5-mythos-5" target="_blank" rel="nofollow noopener" data-offer-url="https://www.anthropic.com/news/claude-fable-5-mythos-5" data-event-click='{"pattern":"ExternalLink"}' data-event-boundary="click" data-in-view='{"pattern":"ExternalLink"}' data-include-experiments="true">一篇博文中写道</a>。</p> <p>考虑到这一点,该公司最初向一个精选联盟发布了一个名为Mythos Preview的版本,作为名为Project Glasswing的工作组的一部分。Mythos 5上周也私下发布给该小组,而Claude Fable 5(一款Mythos级别的模型)则向公众发布,但在其回答生物学和网络安全问题的能力上设置了特定限制。</p><p><a href="https://arstechnica.com/ai/2026/06/dangerous-ai-models-are-coming-no-matter-what/">阅读全文</a></p> <p><a href="https://arstechnica.com/ai/2026/06/dangerous-ai-models-are-coming-no-matter-what/#comments">评论</a></p>
查看原文
查看缓存全文

缓存时间: 2026/06/17 20:42

# “危险”的AI模型无论如何都会到来 来源:https://arstechnica.com/ai/2026/06/dangerous-ai-models-are-coming-no-matter-what/ “认为除了Anthropic之外没有其他竞争对手能开发出类似Mythos的能力,甚至认为他们还没有开发出来,这简直是短视到极点,”专业网络安全咨询公司TPO Group的首席安全官Tarah Wheeler表示。“还有其他公司紧追在Anthropic之后,很可能也拥有这些能力,只是将它们保留在手中,观望Anthropic在当前监管环境中的待遇。” 自Mythos Preview推出以来,Anthropic本身也一直在强调这一点。“真正的信息是,这与模型或Anthropic无关,”该公司前沿红队负责人Logan Graham在四月份Mythos Preview发布时告诉WIRED。“我们现在需要为一个在6、12、24个月内这些能力将广泛可用的世界做好准备。” 例如,OpenAI也在四月中旬私下发布了一个专注于网络安全的模型(https://www.wired.com/story/in-the-wake-of-anthropics-mythos-openai-has-a-new-cybersecurity-model-and-strategy/),并宣布了扩展的网络安全策略。 研究人员指出,即便在下一代模型出现之前,现有的AI产品也可以通过精细化的工具框架用于高级漏洞挖掘和漏洞利用开发。一大群网络安全领导人周日在给政府的一封公开信(https://freefable.org/)中强调了这一点,认为白宫的出口管制指令是错误的。 “并非仅仅是某一个模型的问题,而是技术的整体趋势,”哈佛大学和多伦多大学的研究员Bruce Schneier表示,他一直在分析(https://www.theguardian.com/commentisfree/2026/jun/16/anthropic-fable-ai)这一情况。“更小、更便宜、开源的模型,有时单打独斗,有时相互协作,可以通过更复杂的提示词匹配Mythos/Fable的表现。我们应该预期其他模型在几个月内能达到Mythos/Fable的创造力和坚韧性——开源模型则需要稍长的时间。” 专家表示,白宫和世界各国政府需要关注的是,民主地制定更广泛、更透明的计划,以便应对AI能力在网络安全和其他敏感领域不可避免的进步。 “政策问题不在于一项技术是否有风险,”云安全公司Veracode的联合创始人Chris Wysopal说。“问题在于,某项具体的限制是否有效地降低了风险,还是主要拖慢了那些试图让系统更安全的人。” *本文最初发表于wired.com(https://www.wired.com/story/dangerous-ai-models-are-coming-no-matter-what/)。*

相似文章

这些AI模型免费、私密,且永远不会说'不'

Reddit r/artificial

本文探讨了开放权重AI模型的日益普及,这些模型的安全护栏可以轻易移除,从而使它们能够无拒绝地回答有害请求,引发了关于滥用和国家安全的重大担忧。