privacy-benchmark

#privacy-benchmark

POLAR-Bench：用于LLM智能体中隐私-效用权衡的诊断基准

arXiv cs.AI ↗ · 2026-05-20 缓存

POLAR-Bench是一个诊断基准，通过测试LLM智能体在受到第三方模型对抗性探测时遵循隐私策略的能力，来评估隐私-效用的权衡。结果显示，前沿模型保护了超过99%的受保护属性，但较小的开源权重模型泄露了一半以上，突显了意图遵循方面的差距。

0 人收藏 0 人点赞