标签
一位没有编程背景的钢琴老师,在5个月内自学编程,推出了testyourllm.com——一个自主AI红队测试工具,能够攻击任何兼容OpenAI的LLM端点。在实时测试中,攻击型AI“Tron”首次尝试就攻破了Llama 3.3 70B。
介绍Claude-BugHunter,一个为Claude Code设计的技能包,包含71个技能、15个斜杠命令和681份公开报告模式,旨在将Claude Code转化为高级漏洞赏金猎人或红队操作员。
陶哲轩演示如何使用 Claude Code 作为红队工具,将 Lean 代码风格对齐 Mathlib 官方风格指南,并以 Riemann–Stieltjes 积分的形式化项目为例,展示了 AI 在代码审计和风格对齐中的实用价值。
Claude Mythos AI发现了一种新型攻击向量,在五天内以3.5万美元的成本绕过了苹果M5芯片的防御系统,并生成一份55页的报告交付给苹果。该漏洞通过污染芯片摄入的数据,规避了苹果的MIE系统。
Arc Gate 是一个用于LLM智能体的运行时治理层,强制执行指令-权限边界。该项目已推出公开红队环境,用户可提交攻击并获取完整安全追踪信息,基准测试显示其实现了100%的不安全行为阻止率。
Anthropic的Frontier Red Team评估了大型语言模型如何加速N-day漏洞的利用,发现Claude Mythos Preview能够自主构建针对18个Firefox补丁中的8个以及21个Windows内核补丁中的8个的有效漏洞利用,强调了补丁间隙期间威胁的增加。