@mylifcc: AI 安全红队神器来了！刚刚发现一个超硬核的开源项目 —— DeepTeam！由 Confident AI 出品，基于 DeepEval 打造的 LLM Red Teaming 框架，专门用来“黑”你自己的大模型： 50+ 种真实漏洞…

X AI KOLs Timeline 2026/05/09 17:53 工具

摘要

Confident AI 发布了名为 DeepTeam 的开源 LLM 红队测试框架，支持 50+ 种漏洞检测和 20+ 种对抗攻击，旨在帮助开发者安全地测试大语言模型。

AI 安全红队神器来了！刚刚发现一个超硬核的开源项目 —— DeepTeam！由 Confident AI 出品，基于 DeepEval 打造的 LLM Red Teaming 框架，专门用来“黑”你自己的大模型： 50+ 种真实漏洞（PII 泄露、越狱、Prompt Injection、SQL 注入、偏见、毒性、工具滥用…） 20+ 种对抗攻击（单轮 + 多轮线性/树状 jailbreaking）原生支持 OWASP Top 10 for LLM、NIST AI RMF、MITRE ATLAS 等主流安全框架内置 7 个生产级 Guardrails，实时拦截一行代码就能跑本地红队测试，完全本地执行

查看原文

@mylifcc: AI 安全红队神器来了！刚刚发现一个超硬核的开源项目 —— DeepTeam！由 Confident AI 出品，基于 DeepEval 打造的 LLM Red Teaming 框架，专门用来“黑”你自己的大模型： 50+ 种真实漏洞…

相似文章

@DailyDoseOfDS_: OpenAI 为此支付了 50 万美元！> 寻找 LLM 漏洞的 Kaggle 竞赛 DeepTeam 免费实现 20+…

TRIDENT：通过三维多样化红队数据合成增强大型语言模型安全性

用人和AI推进红队测试

RedBench：大型语言模型综合红队测试通用数据集

评估先进AI的潜在网络安全威胁

提交意见反馈