risk-discovery

标签

Cards List
#risk-discovery

大规模安全测试LLM智能体:从风险发现到基于证据的验证

arXiv cs.AI · 13小时前 缓存

本文介绍了Vera,一个面向LLM智能体的端到端自动化安全测试框架,它结合了文献驱动的风险发现、安全案例的组合式构建以及基于证据的验证。在四个智能体框架上的评估揭示了显著的安全缺陷,在多通道攻击下平均攻击成功率高达93.9%,同时发布了包含1600个可执行安全案例的Vera-Bench。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈