vulnerability-assessment

标签

Cards List
#vulnerability-assessment

免费AI代理安全评估

Reddit r/AI_Agents · 2026-06-01

Antitech 为AI代理提供免费的早期安全评估服务,针对提示注入、工具滥用、数据泄露等攻击向量进行测试,并提供漏洞报告和参与折扣。

0 人收藏 0 人点赞
#vulnerability-assessment

RedBench:大型语言模型综合红队测试通用数据集

arXiv cs.CL · 2026-04-20 缓存

RedBench 引入了一个通用数据集,聚合了 37 个基准数据集,包含 29,362 个样本,涵盖 22 个风险类别和 19 个领域,用于实现大型语言模型的标准化和综合红队测试评估。该工作解决了现有红队测试数据集中的不一致问题,并提供了基准、评估代码和开源资源,用于评估 LLM 对对抗提示的鲁棒性。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈