标签
OpenAI 解释了为什么 Codex Security 刻意避免从 SAST 报告开始,而是直接分析仓库架构并验证发现。该方法解决了核心挑战:最困难的漏洞涉及安全检查是否在整个转换链中实际起作用,而不仅仅是数据流跟踪。
OpenAI 推出 Codex Security,这是一款现处于研究预览阶段的自主应用程序安全工具。它能高置信度识别复杂漏洞并提供可操作的修复方案,同时与传统的安全工具相比,显著减少误报和噪音。
OpenAI 和 Paradigm 推出了 EVMbench,这是一个用于评估 AI 代理在检测、修复和利用智能合约漏洞方面能力的基准测试,涵盖来自 40 次审计的 117 个精选漏洞。该基准测试显示 GPT-5.3-Codex 在利用任务上达到了 71% 的成功率,显著优于 GPT-5 的 33.3%,而检测和修复任务仍然更具挑战性。
OpenAI 宣布推出 Aardvark,这是一个基于 GPT-5 的 AI 智能体安全研究工具,能够自动识别、验证和修补代码库中的软件漏洞。该工具与 GitHub 和开发工作流集成,帮助安全团队大规模发现和修复漏洞。
Google DeepMind 推出 CodeMender,一个 AI 代理,可以使用先进的推理和验证技术自动检测和修复代码安全漏洞。该系统在六个月内已向开源项目上游贡献了 72 个安全修复。
Anthropic launched Project Glasswing, using its advanced Claude Mythos model to help critical software organizations discover and fix vulnerabilities, aiming to enhance global software security through collective defense.