span-level

标签

Cards List
#span-level

超越文档基础:代码、工具输出和文档上的跨度级幻觉检测

arXiv cs.CL · 昨天 缓存

本文介绍了一个统一的基准,用于RAG系统中的跨度级幻觉检测,该基准超越了自然语言,扩展到代码、工具输出和结构化文档,并展示了一个微调的Qwen3.5-2B检测器,该检测器在这些新领域上优于现有方法,同时在标准NLP基准上保持竞争力。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈