标签
Codex Security 上线三个月已扫描3万个代码库、超3000万次提交,修复超50万个漏洞,展示了AI自动化的高效。
OpenAI推出Daybreak扩展计划,旨在用AI自动化修复漏洞,解决当前安全领域找到漏洞但无人修复的瓶颈。
Anthropic 发布了一个开源参考实现,用于基于 Claude 的自主漏洞发现与修复,涵盖完整流水线(侦察 → 发现 → 验证 → 报告 → 修补),并支持沙箱隔离。该框架配套 Claude Security 托管产品,可用于管理代码库中的漏洞。
Anthropic 发布了一个开源代码审计参考工具,用于使用 Claude 进行自主漏洞发现和修复,涵盖了 recon→find→triage→report→patch 流程,主要针对 C/C++ 内存漏洞。它是一个模板/参考实现,而非生产就绪产品,同时还提供名为 Claude Security 的托管选项。
Anthropic 通过 Project Glasswing 项目,将其 Mythos AI 网络安全模型的访问权限扩展至超过 15 个国家的 150 家额外组织,涵盖电力、水务、医疗和通信等关键基础设施领域。
Astra Security 推出一款自主渗透测试产品,利用AI代理自动发现、验证并修复漏洞。
韩国HackerOne排名第一的黑客Hyunseo Shin在一篇后续文章中详细介绍了他的基于AI的漏洞检测工作流程,利用LLM代理发现开源零日漏洞。
NVIDIA 发布了 SkillSpector,这是一个用于 AI agent 技能的开源安全扫描器,可在安装前检测提示注入和数据泄露等漏洞。
PromptAudit是一个受控评估框架,通过隔离提示表述对基于LLM的漏洞检测的影响,发现思维链提示在整体性能上表现最佳,同时提示敏感性必须被视为一级系统属性。
一篇评论指出,AI发现更多安全漏洞的能力将增加对人类工程师进行漏洞分类和修复的需求,并预测安全工程师将迎来繁荣期。
Anthropic的Project Glasswing利用Claude Mythos Preview在关键软件中发现了超过10,000个高危或严重漏洞,合作伙伴如Cloudflare报告称漏洞发现率提高了十倍,这凸显了从发现漏洞到修复漏洞的瓶颈转移。
Cloudflare 分享了他们使用 Anthropic 的 Mythos Preview 模型的经验,该模型自主发现了主要操作系统和网络浏览器中的高严重性漏洞。该模型在串联利用原语时展现出高级推理能力,但安全护栏不一致,凸显了在公开发布前需要加强防护措施。
网络安全初创公司Depthfirst声称,其AI模型发现了Anthropic的Mythos系统遗漏的关键漏洞,以十分之一的成本实现了相同的结果。
微软的MDASH多智能体AI系统,利用超过100个专业智能体,在CyberGym网络安全基准测试中超越了Anthropic的Mythos,能够有效发现并确认真实世界的软件漏洞。
DeepTeam 是一款免费的开源工具,实现了 20 多种最先进的攻击技术,可检测包括偏见和个人信息(PII)泄露在内的 50 多种 LLM 漏洞,可在本地运行且无需数据集。
Mozilla 借助 Claude Mythos 预览版系统性地发现并修复了 Firefox 中数百个安全漏洞,使其漏洞修复率从每月约 20-30 个大幅提升至 2026 年 4 月的 423 个。
Mozilla 详细介绍了他们如何利用 Claude Mythos Preview 及其他 AI 模型识别并修复了 Firefox 中的大量潜在安全漏洞,展示了 AI 在代码加固方面效能的提升。
Firefox 150 随 Anthropic 的 Claude Mythos Preview 发现的 271 个安全修复一同发布,标志着防御性安全的一次重大 AI 驱动胜利。
Mozilla 利用 Anthropic 的 Claude Mythos Preview AI,在 Firefox 150 中找出并修复了 271 个零日漏洞,标志着网络安全格局的重大转变:AI 让防御者首次能够彻底甩开攻击者。
英国AI Safety Institute对Claude Mythos的评估表明,人工智能驱动的安全漏洞检测创造了一种新的经济模式,其中网络安全变成了一场代币消耗竞赛,激励对安全审查的持续投资,并使开源库作为共享安全基础设施更有价值。