vulnerability-assessment

#vulnerability-assessment

免费AI代理安全评估

Reddit r/AI_Agents ↗ · 2026-06-01

Antitech 为AI代理提供免费的早期安全评估服务，针对提示注入、工具滥用、数据泄露等攻击向量进行测试，并提供漏洞报告和参与折扣。

0 人收藏 0 人点赞

#vulnerability-assessment

RedBench：大型语言模型综合红队测试通用数据集

arXiv cs.CL ↗ · 2026-04-20 缓存

RedBench 引入了一个通用数据集，聚合了 37 个基准数据集，包含 29,362 个样本，涵盖 22 个风险类别和 19 个领域，用于实现大型语言模型的标准化和综合红队测试评估。该工作解决了现有红队测试数据集中的不一致问题，并提供了基准、评估代码和开源资源，用于评估 LLM 对对抗提示的鲁棒性。

0 人收藏 0 人点赞

vulnerability-assessment

免费AI代理安全评估

RedBench：大型语言模型综合红队测试通用数据集

提交意见反馈