red-team

标签

Cards List
#red-team

5个月前我自学编程,打造了一款自主AI红队测试工具——testyourllm.com

Reddit r/artificial · 昨天

一位没有编程背景的钢琴老师,在5个月内自学编程,推出了testyourllm.com——一个自主AI红队测试工具,能够攻击任何兼容OpenAI的LLM端点。在实时测试中,攻击型AI“Tron”首次尝试就攻破了Llama 3.3 70B。

0 人收藏 0 人点赞
#red-team

@XAMTO_AI: 别再拿Claude Code当聊天机器人用了,真正会玩的人早就给它塞满了黑客脑子。 51个实战技能 574+报告模板 24类漏洞打法,一键上身,菜鸟秒变老练赏金猎人。 你还在那儿观望,别人已经开始收漏洞奖金了。 https://githu…

X AI KOLs Timeline · 2026-06-14 缓存

介绍Claude-BugHunter,一个为Claude Code设计的技能包,包含71个技能、15个斜杠命令和681份公开报告模式,旨在将Claude Code转化为高级漏洞赏金猎人或红队操作员。

0 人收藏 0 人点赞
#red-team

Golfing and stylistically aligning a proof using Claude Code | Another Certified Hood Classic by Terrance Tao and Claude

Reddit r/singularity · 2026-05-23 缓存

陶哲轩演示如何使用 Claude Code 作为红队工具,将 Lean 代码风格对齐 Mathlib 官方风格指南,并以 Riemann–Stieltjes 积分的形式化项目为例,展示了 AI 在代码审计和风格对齐中的实用价值。

0 人收藏 0 人点赞
#red-team

@cryptopunk7213: claude mythos刚刚攻破了苹果价值20亿美元的防御系统。它通过发现一个完全不同的攻击向量……

X AI KOLs Timeline · 2026-05-15

Claude Mythos AI发现了一种新型攻击向量,在五天内以3.5万美元的成本绕过了苹果M5芯片的防御系统,并生成一份55页的报告交付给苹果。该漏洞通过污染芯片摄入的数据,规避了苹果的MIE系统。

0 人收藏 0 人点赞
#red-team

我们为AI智能体安全代理构建了一个公开的红队环境——提交攻击即可获得完整的安全追踪信息

Reddit r/artificial · 2026-05-14

Arc Gate 是一个用于LLM智能体的运行时治理层,强制执行指令-权限边界。该项目已推出公开红队环境,用户可提交攻击并获取完整安全追踪信息,基准测试显示其实现了100%的不安全行为阻止率。

0 人收藏 0 人点赞
#red-team

2026年6月8日 Frontier Red Team 测量LLM对N-day漏洞利用的影响

Anthropic Research · 2026-06-17 缓存

Anthropic的Frontier Red Team评估了大型语言模型如何加速N-day漏洞的利用,发现Claude Mythos Preview能够自主构建针对18个Firefox补丁中的8个以及21个Windows内核补丁中的8个的有效漏洞利用,强调了补丁间隙期间威胁的增加。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈