red-team

#red-team

5个月前我自学编程，打造了一款自主AI红队测试工具——testyourllm.com

Reddit r/artificial ↗ · 昨天

一位没有编程背景的钢琴老师，在5个月内自学编程，推出了testyourllm.com——一个自主AI红队测试工具，能够攻击任何兼容OpenAI的LLM端点。在实时测试中，攻击型AI“Tron”首次尝试就攻破了Llama 3.3 70B。

0 人收藏 0 人点赞

#red-team

X AI KOLs Timeline ↗ · 2026-06-14 缓存

介绍Claude-BugHunter，一个为Claude Code设计的技能包，包含71个技能、15个斜杠命令和681份公开报告模式，旨在将Claude Code转化为高级漏洞赏金猎人或红队操作员。

0 人收藏 0 人点赞

#red-team

Reddit r/singularity ↗ · 2026-05-23 缓存

陶哲轩演示如何使用 Claude Code 作为红队工具，将 Lean 代码风格对齐 Mathlib 官方风格指南，并以 Riemann–Stieltjes 积分的形式化项目为例，展示了 AI 在代码审计和风格对齐中的实用价值。

0 人收藏 0 人点赞

#red-team

X AI KOLs Timeline ↗ · 2026-05-15

Claude Mythos AI发现了一种新型攻击向量，在五天内以3.5万美元的成本绕过了苹果M5芯片的防御系统，并生成一份55页的报告交付给苹果。该漏洞通过污染芯片摄入的数据，规避了苹果的MIE系统。

0 人收藏 0 人点赞

#red-team

Reddit r/artificial ↗ · 2026-05-14

Arc Gate 是一个用于LLM智能体的运行时治理层，强制执行指令-权限边界。该项目已推出公开红队环境，用户可提交攻击并获取完整安全追踪信息，基准测试显示其实现了100%的不安全行为阻止率。

0 人收藏 0 人点赞

#red-team

Anthropic Research ↗ · 2026-06-17 缓存

Anthropic的Frontier Red Team评估了大型语言模型如何加速N-day漏洞的利用，发现Claude Mythos Preview能够自主构建针对18个Firefox补丁中的8个以及21个Windows内核补丁中的8个的有效漏洞利用，强调了补丁间隙期间威胁的增加。

0 人收藏 0 人点赞