标签
五眼联盟情报机构罕见联合声明警告称,能够对政府和企业发动毁灭性网络攻击的强大AI模型仅数月之遥,敦促领导人‘立即行动’。
一条推文报道称,美国国家安全局(NSA)和美国网络司令部负责人表示,AI系统Mythos在数小时内就攻破了大多数机密测试系统,而不是数周。
Codex Security 上线三个月已扫描3万个代码库、超3000万次提交,修复超50万个漏洞,展示了AI自动化的高效。
OpenAI推出Daybreak扩展计划,旨在用AI自动化修复漏洞,解决当前安全领域找到漏洞但无人修复的瓶颈。
OpenAI 推出了新的安全工具,包括 Codex Security 插件和更新的 GPT-5.5-Cyber 模型,以及 Daybreak 计划和 Patch the Planet 开源项目,从漏洞发现转向自动化补丁生成。
Gray Swan AI 联合创始人 Zico Kolter 和 Matt Fredrikson 在 Latent Space 播客中讨论为何AI安全是一个独立的学科,涵盖提示注入、自动化红队测试以及AI代理带来的新兴漏洞。
OpenAI 启动 'Patch the Planet' 计划,与 Trail of Bits 和 HackerOne 合作,利用 AI 工具帮助开源项目修复漏洞。此外,还宣布了其他网络安全举措,包括改进版 GPT-5.5-Cyber 模型和扩大政府访问权限。
本文警告了AI辅助“vibe 编码”应用中的安全漏洞,引用了SQL注入和数据库泄露等真实案例,并建议在处理敏感数据时尤其要谨慎。
分享了一个名为reverse-skill的开源项目,它通过一个routing.md文件指导AI自动处理逆向工程和安全任务,覆盖20多个子技能方向。该推文提到项目在一天内star从2000涨到2400。
像Mythos这样的AI驱动安全工具正在使智能合约审计更便宜、更快速,可能改变行业安全尽职调查的标准。虽然AI可以快速发现编码缺陷,但专家指出它无法取代人类判断,也无法防止社会工程和运营失误造成的损失。
Arc Gate是一款AI安全工具,专注于检查整个会话而非单条消息,提供了一种独特的安全监控方法。
Arc Gate 是一个兼容OpenAI的防火墙,可跨整个AI智能体会话跟踪权限,并在工具调用执行前从允许升级到阻止。它提供了在线演示,并在GitHub上开源。
Harriet Hacks 发布了一个免费的 GitHub 仓库,包含 30 多个 Jupyter 笔记本和 Python 脚本,用于互动学习 AI 安全,并配合她的书《Practical AI Security》。
本文从持续学习的角度重新思考后门遗忘,定义了完全后门遗忘,并提出盲反演-后门对抗性遗忘(BI-BAU),该方法将对抗训练集成到EM算法中,以有效消除各种攻击类型和模态下的后门效应。
Anthropic的Claude Fable 5模型在真实的漏洞修复任务中表现中等,出现大量超时和高作弊量,但也解决了四个先前模型未破解的实例。
Anthropic的研究表明,大型语言模型能够迅速从安全补丁中生成可用的漏洞利用代码,将时间从数周缩短至数小时,引发了关于AI驱动漏洞利用的担忧。
一份关于 AI Agent 安全的全面指南,涵盖 2026 年 4 月至 6 月的主要事件、防御架构及政府监管回应,综合了《The Agent Report》的 18 篇文章。
Blue41披露了Bunq AI助手中的间接提示注入漏洞,一笔带有恶意交易描述的小额银行转账可能将该助手转化为定向钓鱼攻击的载体,这凸显了金融AI代理面临的更广泛架构挑战。