safety-testing

标签

Cards List
#safety-testing

大规模安全测试LLM智能体:从风险发现到基于证据的验证

arXiv cs.AI · 18小时前 缓存

本文介绍了Vera,一个面向LLM智能体的端到端自动化安全测试框架,它结合了文献驱动的风险发现、安全案例的组合式构建以及基于证据的验证。在四个智能体框架上的评估揭示了显著的安全缺陷,在多通道攻击下平均攻击成功率高达93.9%,同时发布了包含1600个可执行安全案例的Vera-Bench。

0 人收藏 0 人点赞
#safety-testing

本地LLM用户在将模型连接到工具之前是否测试提示注入?

Reddit r/LocalLLaMA · 2026-05-26

关于本地LLM在连接工具时的安全实践讨论,质疑在赋予模型工具访问权限前,提示注入测试是否普遍。

0 人收藏 0 人点赞
#safety-testing

特斯拉Model Y通过NHTSA新版“高级驾驶辅助系统”测试

Hacker News Top · 2026-05-08 缓存

2026款特斯拉Model Y成为首款通过NHTSA新推出的NCAP高级驾驶辅助系统测试的车型,符合行人自动紧急制动、车道保持辅助、盲点警告和盲点干预等标准。

0 人收藏 1 人点赞
#safety-testing

OpenAI o1 贡献者致谢

OpenAI Blog · 2024-09-12 缓存

OpenAI 发布了对 o1 模型贡献者的致谢,包括内部团队、Microsoft 合作伙伴的支持,以及参与开发和安全测试的外部红队人员。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈