tract-scorer

标签

Cards List
#tract-scorer

长文本幻觉检测的健全性检验

arXiv cs.CL · 2026-05-12 缓存

本文介绍了一种受控不变性方法以及两种测试(Force 和 Remove),旨在确定大语言模型(LLM)幻觉检测器是依赖于推理过程还是最终答案的特征。研究提出了 TRACT,这是一种基于词汇特征的轻量级评分器,证明了其在不依赖答案层面线索的情况下仍能保持鲁棒的性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈