multimodal-guardrails

标签

Cards List
#multimodal-guardrails

OSGuard:计算机使用代理安全基准测试

arXiv cs.AI · 昨天 缓存

OSGuard是一个双粒度基准测试,用于在良性用户指令下评估计算机使用代理的安全性,包含动作级判断和风险增强执行套件,以检测不安全捷径。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈