tract-scorer

#tract-scorer

长文本幻觉检测的健全性检验

arXiv cs.CL ↗ · 2026-05-12 缓存

本文介绍了一种受控不变性方法以及两种测试（Force 和 Remove），旨在确定大语言模型（LLM）幻觉检测器是依赖于推理过程还是最终答案的特征。研究提出了 TRACT，这是一种基于词汇特征的轻量级评分器，证明了其在不依赖答案层面线索的情况下仍能保持鲁棒的性能。

0 人收藏 0 人点赞