self-evolving-defense

#self-evolving-defense

BraveGuard：从开放世界威胁到更安全的计算机使用代理

Hugging Face Daily Papers ↗ · 2026-06-02 缓存

BraveGuard 是一个自我演化的防御框架，通过利用开放世界威胁信号和真实的代理轨迹来训练防护模型，从而提升计算机使用代理的安全检测能力，在 AgentHazard 基准上取得了显著的准确率提升。

0 人收藏 0 人点赞