conflicting-evidence

标签

Cards List
#conflicting-evidence

ConflictScore: 识别与衡量语言模型如何处理矛盾证据

arXiv cs.CL · 2天前 缓存

ConflictScore是一种新度量,用于量化语言模型在面对其基础文档中的矛盾证据时的识别能力,它将响应分解为原子声明并衡量矛盾平衡。论文还引入了ConflictBench,这是一个涵盖多种矛盾形式的基准测试,并展示了该度量可以提高TruthfulQA上的真实性。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈