risk-discovery

#risk-discovery

大规模安全测试LLM智能体：从风险发现到基于证据的验证

arXiv cs.AI ↗ · 13小时前缓存

本文介绍了Vera，一个面向LLM智能体的端到端自动化安全测试框架，它结合了文献驱动的风险发现、安全案例的组合式构建以及基于证据的验证。在四个智能体框架上的评估揭示了显著的安全缺陷，在多通道攻击下平均攻击成功率高达93.9%，同时发布了包含1600个可执行安全案例的Vera-Bench。

0 人收藏 0 人点赞