open-world-threats

标签

Cards List
#open-world-threats

BraveGuard:从开放世界威胁到更安全的计算机使用代理

Hugging Face Daily Papers · 2026-06-02 缓存

BraveGuard 是一个自我演化的防御框架,通过利用开放世界威胁信号和真实的代理轨迹来训练防护模型,从而提升计算机使用代理的安全检测能力,在 AgentHazard 基准上取得了显著的准确率提升。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈