proxy-analyzer

#proxy-analyzer

基于开权重代理分析器激活的幻觉检测

arXiv cs.CL ↗ · 6天前缓存

本文介绍了一种代理分析器框架，通过分析小型开权重模型的内部激活状态而非生成模型本身，来检测大型语言模型中的幻觉。与 ReDeEP 等现有方法相比，该方法在 RAGTruth 等基准测试中表现出更优越的性能，证明了分析方法的优劣比模型大小更为关键。

0 人收藏 0 人点赞