@AnthropicAI: 修复这些漏洞将让我们更安全。但软件行业需要适应漏洞数量的增长…
摘要
Anthropic的Project Glasswing利用Claude Mythos Preview在关键软件中发现了超过10,000个高危或严重漏洞,合作伙伴如Cloudflare报告称漏洞发现率提高了十倍,这凸显了从发现漏洞到修复漏洞的瓶颈转移。
查看缓存全文
缓存时间: 2026/05/22 20:49
修复这些漏洞将使我们的系统更加安全。但软件行业将需要适应像Claude Mythos Preview这样的模型所能发现的大量漏洞。
我们在Project Glasswing的首次更新中讨论了这一点:https://t.co/3cSgHHZXgG
Project Glasswing:首次更新
来源:https://www.anthropic.com/research/glasswing-initial-update 上个月,我们启动了Project Glasswing(https://www.anthropic.com/glasswing),这是一项合作努力,旨在保护全球最关键的软件,以防日益强大的AI模型被用于攻击。
自那以后,我们和大约50个合作伙伴已经使用Claude Mythos Preview在全球系统性最重要的软件中发现了超过一万个高或严重严重性漏洞。软件安全的进展曾经受限于我们寻找新漏洞的速度。现在,它受限于我们验证、披露和修补AI发现的大量漏洞的速度。
在这篇文章中,我们讨论在Project Glasswing最初几周里,我们对于这一网络安全关键挑战的发现。我们重点关注Mythos Preview性能的早期公开证据、扫描数千个开源软件项目的初步结果,以及这一进展对当前网络防御者的意义。我们还介绍了Project Glasswing下一步的预期,以及我们未来如何考虑发布Mythos级别的模型。
我们的早期结果
我们讨论Mythos Preview发现的方法
软件行业的长期惯例是在发现新漏洞后90天内进行披露(或者,如果在90天之前创建了补丁,则在补丁可用后大约45天)。这允许终端用户在攻击者利用漏洞之前有时间更新软件。我们自己的协调漏洞披露政策(https://www.anthropic.com/coordinated-vulnerability-disclosure)采用了这种方法。
然而,这意味着已披露的漏洞是AI模型网络能力加速发展的滞后指标:我们目前还无法在不使用户面临风险的情况下,详细描述合作伙伴使用Mythos Preview的所有发现。因此,我们提供模型性能的说明性示例,以及我们迄今进展的汇总统计数据。一旦Mythos Preview发现的漏洞的补丁被广泛部署,我们将提供更多关于我们所学到的细节。
来自合作伙伴和外部测试者的证据
Project Glasswing的初始合作伙伴构建和维护对互联网及其他关键基础设施运作至关重要的软件。修复他们代码中的缺陷降低了依赖该代码的其他组织的风险,从而减少了数十亿终端用户的风险。
一个月后,大多数合作伙伴在他们的软件中各自发现了数百个严重或高严重性漏洞。总体上,他们发现了超过一万个漏洞。有几位告诉我们,他们的漏洞发现率提高了十倍以上。例如,Cloudflare(https://blog.cloudflare.com/cyber-frontier-models/)在他们的关键路径系统中发现了2000个漏洞(其中400个是高或严重严重性),且误报率低于人类测试者。
这与外部测试者对Mythos Preview性能的体验以及近期对该模型的额外评估一致:
- 英国AI安全研究所报告(https://www.aisi.gov.uk/blog/how-fast-is-autonomous-ai-cyber-capability-advancing),Mythos Preview是首个端到端解决他们所有网络靶场(多步骤网络攻击模拟)的模型;
- Mozilla在测试Mythos Preview时发现并修复了Firefox 150中的271个漏洞(https://blog.mozilla.org/en/privacy-security/ai-security-zero-day-vulnerabilities/)(https://hacks.mozilla.org/2026/05/behind-the-scenes-hardening-firefox/)——比用Claude Opus 4.6在Firefox 148中发现的漏洞多十倍以上;
- XBOW,独立安全平台,报告(https://xbow.com/blog/mythos-offensive-security-xbow-evaluation)Mythos Preview在其Web漏洞利用基准测试中是“相较于所有现有模型的重要提升”,并且在逐token基础上提供了“绝对前所未有的精确度”;
- ExploitBench(http://exploitbench.ai/)和ExploitGym(https://arxiv.org/abs/2605.11086),两个近期发布的用于衡量模型漏洞利用能力的学术基准,显示Mythos Preview是最强者。我们在前沿红队博客(https://red.anthropic.com/2026/exploit-evals/)上更详细地讨论了这些基准告诉我们关于模型的信息。
更普遍地,我们现在看到经过修补的软件正在更快地推出。最新的Palo Alto Networks版本包含了超过平常五倍(https://www.paloaltonetworks.com/blog/2026/05/defenders-guide-frontier-ai-impact-cybersecurity-may-2026-update/)的补丁。微软报告(https://www.microsoft.com/en-us/msrc/blog/2026/05/a-note-on-patch-tuesday)称,他们将发布的新补丁数量“将在一定程度上继续呈增长趋势”。Oracle发现和修复其产品和云中的漏洞的速度比之前快了数倍(https://blogs.oracle.com/security/accelerating-vulnerability-detection-and-response-at-oracle)。
Mythos Preview还被证明对其他类型的安全工作有用。例如,在我们的一家Glasswing合作银行中,Mythos Preview帮助检测并阻止了一笔150万美元的欺诈性电汇,此前攻击者入侵了客户的电子邮件账户并进行了伪造电话。
开源软件
在过去几个月里,Anthropic使用Mythos Preview扫描了超过1000个开源项目,这些项目共同支撑了互联网的大部分基础设施——以及我们自己的大部分基础设施。
到目前为止,Mythos Preview在这些项目中估计发现了6,202个高或严重严重性漏洞(总共23,019个,包括估计为中等或低严重性的漏洞)。
其中,1,752个被评估为高或严重严重的漏洞已经由六家独立安全研究公司中的一家进行了仔细评估,少数情况下由我们自己评估。其中,90.6%(1,587个)被证明是有效的真实确认,62.4%(1,094个)被确认为高或严重严重性。这意味着即使Mythos Preview不再发现新漏洞,按照我们当前分类后的真实阳性率,它有望在开源代码中浮现出近3,900个高或严重严重性漏洞——这还不包括它为Project Glasswing合作伙伴发现的漏洞。需要明确的是,我们打算继续扫描开源代码一段时间,因此我们预计这个数字还会上升。
Mythos Preview检测到的一个开源漏洞示例出现在wolfSSL(https://www.wolfssl.com/)中,这是一个以安全性著称的开源密码学库,被全球数十亿设备使用。Mythos Preview构建了一个漏洞利用(https://www.wolfssl.com/how-claude-mythos-preview-helped-harden-wolfssl/),可让攻击者伪造证书,从而(例如)允许他们托管银行或电子邮件提供商的虚假网站。该网站对终端用户来说看起来完全合法,尽管实际上由攻击者控制。我们将在未来几周内发布对这个现已修补的漏洞(分配CVE-2026-5194(https://nvd.nist.gov/vuln/detail/CVE-2026-5194))的完整技术分析。
正如我们上面指出的,修复这些漏洞的瓶颈在于人类进行分类、报告、设计以及部署补丁的能力。而使用Mythos Preview首先发现这些漏洞已经变得非常简单。我们在下面创建了一个已扫描的开源漏洞仪表板(https://red.anthropic.com/2026/cvd/),展示了我们披露过程中的不同步骤,并将跟踪我们的进展。这显示了所有严重级别的漏洞,而不仅仅是Mythos Preview最初评估为高或严重严重性的子集。注意每个阶段的急剧下降,反映了验证和修复每个漏洞所需的人力工作量。
我们的开源漏洞仪表板,显示所有严重级别的漏洞(而不仅仅是Mythos Preview估计的高或严重严重性)。 我们对漏洞进行分类的过程是密集的。首先,我们或与我们合作的外部安全公司之一重现Mythos发现的问题,并重新评估其严重性。一旦我们确认漏洞是真实的,我们会检查是否已有修复措施,并向软件维护者编写详细报告。我们非常谨慎:除了维护开源软件的常规挑战外,维护者还面临着低质量的AI生成的漏洞报告洪流。事实上,几位维护者告诉我们,他们目前严重能力不足,有些人甚至要求我们放慢披露速度,因为他们需要更多时间来设计补丁。(平均而言,Mythos Preview发现的一个高或严重严重性漏洞需要两周时间才能修补。)
根据维护者的要求,我们有时直接披露漏洞,而不做进一步评估。现在我们已经报告了1,129个此类未经审查的漏洞,其中Mythos Preview估计有175个是高或严重严重性。
我们估计至今已向维护者披露了530个高或严重严重性漏洞。这基于Claude对直接披露案例的严重性评估,以及维护者或我们安全合作伙伴的评估(如果有)。还有另外827个确认的漏洞(以相同方式估计为高或严重严重性),我们正在尽快披露。
在我们报告的530个高或严重严重性漏洞中,有75个已经打上补丁,其中65个已发布公开公告。补丁数量仍然相对较低,原因有三个。首先,我们仍处于协调漏洞披露政策规定的90天窗口早期:我们预计很快会有更多补丁落地。其次,我们可能低估了补丁数量,因为有些漏洞在修补时没有公开公告:在这种情况下,我们依赖于使用Claude自行扫描补丁。第三,补丁数量少反映了一个真实问题:即使我们披露的速度相对较慢,Mythos Preview也在给已经超负荷的安全生态系统增加负担。
发现漏洞相对容易,而修复漏洞困难,这对网络安全构成了重大挑战。成功应对这一挑战将使我们的软件比以前安全得多。下面我们讨论网络防御者可以适应的一些方法。
适应网络安全的新阶段
与Mythos Preview具有类似网络安全技能的模型很快将更广泛地可用。软件行业显然需要更大的努力来管理这些模型将产生的大量发现。
目前,从发现漏洞到创建补丁,再到终端用户广泛部署补丁,之间往往存在长时间的延迟。这给攻击者留下了利用关键软件的显著窗口。Mythos级别的模型显著缩短了发现和利用漏洞所需的时间和成本,放大了这些时间延迟相关的风险。最终,Mythos级别的模型将使开发者能够通过在部署前捕捉漏洞来构建更安全的软件。但在这个过渡时期——当漏洞被快速发现而缓慢修补时——会带来新的风险。
软件开发者和用户现在应该采取行动,以减少面临这些风险。下面的建议并不新鲜,许多研究人员(包括Anthropic的)目前正在研究更好、更持久的解决方案。与此同时,做好基本工作很重要:
- 软件开发者应缩短补丁周期,并尽快提供安全修复。善用公开可用的AI模型可以帮助实现这一点;我们正在构建工具并分享研究以支持这一点(下面有更多详情)。开发者还应帮助用户保持软件最新,使安装更新尽可能简单;在可行范围内,他们应对仍在运行已知漏洞软件的用户更加坚持。
- 网络防御者应缩短补丁测试和部署时间。美国国家标准与技术研究院(https://www.nist.gov/cyberframework)和英国国家网络安全中心(https://www.ncsc.gov.uk/collection/10-steps/risk-management)等组织制定的关键控制措施现在更加重要,因为它们能在不依赖任何特定补丁及时落地的情况下提高安全性。这些措施包括强化网络默认配置、强制多因素认证、以及保留全面的日志用于检测和响应。
使用公开可用AI模型的网络防御工具
许多通用模型已经能够发现大量软件漏洞,即使它们无法发现最复杂的漏洞,也无法像Claude Mythos Preview那样有效地利用它们。Project Glasswing已经促使许多其他组织使用这些通用模型对自己的代码库采取行动;我们正在努力使这变得更加容易。
首先,我们已经面向Claude Enterprise客户公开发布了Claude Security(https://claude.com/product/claude-security)的公开测试版。这是一个帮助团队扫描代码库中的漏洞,并可以生成建议修复的工具。在发布后的三周内,Claude Opus 4.7已被用来修补超过2,100个漏洞。(这比上面描述的开源修补速度更快,很大程度上是因为企业在修复自己的代码,而开源修复通常需要志愿者维护者通过协调披露来工作。)
我们还启动了网络验证计划(https://support.claude.com/en/articles/14604842-real-time-cyber-safeguards-on-claude),允许安全专业人员出于合法网络安全目的(如漏洞研究、渗透测试和红队演练)使用我们的模型,而无需遵守某些旨在防止网络滥用的安全措施。
现在,我们将自己和合作伙伴使用Mythos Preview所使用过的工具,应要求提供给符合条件的客户的安保团队。我们的目标是让用户在不进行大量设置的情况下,更容易从高能力的公共模型中获得最佳性能。这次发布包括:
- 我们和合作伙伴构建并分享的技能(https://code.claude.com/docs/en/skills)(重复工作的自定义指令);
- 一个帮助Claude映射代码库、启动扫描子代理、分类发现并编写报告的框架;
- 一个威胁模型构建器,用于映射代码库以识别潜在攻击目标,并相应优先级排序模型的工作。
Cisco,我们的Project Glasswing合作伙伴之一,最近也开源了其Foundry Security Spec(https://blogs.cisco.com/ai/announcing-foundry-security-spec),以帮助其他防御者构建
相似文章
2026年5月22日公告Project Glasswing:初步更新
Anthropic的Project Glasswing项目使用Claude Mythos Preview,已在关键软件中发现超过一万个高危或严重漏洞,合作伙伴如Cloudflare报告漏洞发现率提升了十倍。
Anthropic的Claude Mythos Preview模型与50家合作伙伴发现超过10,000个关键软件缺陷
Anthropic的Claude Mythos Preview模型在50家合作伙伴的使用中,已发现超过10,000个高严重性和关键严重性的软件漏洞,其中包括Cloudflare系统中的2,000个bug以及wolfSSL中的一个关键缺陷,这标志着软件安全领域的范式转变。
扩展Project Glasswing
Anthropic正在扩展其网络安全合作项目Project Glasswing,将覆盖约150个新组织,遍布多个国家和行业,为他们提供Claude Mythos Preview的访问权限,以发现关键软件中的漏洞。
An initiative to secure the world's software | Project Glasswing
Anthropic launched Project Glasswing, using its advanced Claude Mythos model to help critical software organizations discover and fix vulnerabilities, aiming to enhance global software security through collective defense.
@logangraham: 很多人一直在关注Mythos、Glasswing以及我们/合作伙伴正在修复的漏洞。今天,我很兴奋……
Anthropic的Claude Mythos Preview模型已经过XBOW和英国AISI的评估,展示了前所未有的自主网络安全能力,包括解决端到端网络靶场以及发现数千个漏洞。该公告强调需要为网络安全领域快速发展的AI能力做好准备。