safety-testing

#safety-testing

大规模安全测试LLM智能体：从风险发现到基于证据的验证

arXiv cs.AI ↗ · 18小时前缓存

本文介绍了Vera，一个面向LLM智能体的端到端自动化安全测试框架，它结合了文献驱动的风险发现、安全案例的组合式构建以及基于证据的验证。在四个智能体框架上的评估揭示了显著的安全缺陷，在多通道攻击下平均攻击成功率高达93.9%，同时发布了包含1600个可执行安全案例的Vera-Bench。

0 人收藏 0 人点赞

#safety-testing

Reddit r/LocalLLaMA ↗ · 2026-05-26

关于本地LLM在连接工具时的安全实践讨论，质疑在赋予模型工具访问权限前，提示注入测试是否普遍。

0 人收藏 0 人点赞

#safety-testing

Hacker News Top ↗ · 2026-05-08 缓存

2026款特斯拉Model Y成为首款通过NHTSA新推出的NCAP高级驾驶辅助系统测试的车型，符合行人自动紧急制动、车道保持辅助、盲点警告和盲点干预等标准。

0 人收藏 1 人点赞

#safety-testing

OpenAI Blog ↗ · 2024-09-12 缓存

OpenAI 发布了对 o1 模型贡献者的致谢，包括内部团队、Microsoft 合作伙伴的支持，以及参与开发和安全测试的外部红队人员。

0 人收藏 0 人点赞