fine-grained-detection

标签

#fine-grained-detection

DECOR：基于信息操纵理论审计LLM欺骗行为

arXiv cs.CL ↗ · 2026-05-20 缓存

介绍了DECOR，一个基于信息操纵理论的多智能体框架，用于细粒度审计LLM回应中的策略性欺骗，在15个前沿模型的欺骗检测基准测试中取得了最先进的性能。

0 人收藏 0 人点赞

← 返回首页

提交意见反馈