fact-verification

标签

Cards List
#fact-verification

CRAFT:面向表格问答与事实验证的统一反事实推理框架

arXiv cs.CL · 2026-06-08 缓存

CRAFT是一个统一的反事实推理框架,通过构建原始陈述和反事实变体,从双向推理路径中提取证据,并通过加权机制进行整合,从而提升了表格问答和事实验证的效果。在WikiTQ和TabFact数据集上的实验表明,该框架持续优于基线方法。

0 人收藏 0 人点赞
#fact-verification

智能体RAG中的级联幻觉:CHARM检测与缓解框架

arXiv cs.AI · 2026-06-04 缓存

本文介绍了CHARM框架,用于检测和缓解多步骤智能体RAG流水线中的级联幻觉问题——早期阶段产生的错误会在推理步骤中不断传播并放大。CHARM在多个基准测试中实现了89.4%的级联检测率和82.1%的错误传播降低率,且延迟开销较低。

0 人收藏 0 人点赞
#fact-verification

从片段到语义:重新思考多语言事实核查的证据粒度

arXiv cs.CL · 2026-05-27 缓存

本文介绍了SEEK,一个用于多语言事实核查中语义证据提取的框架,该框架从完整文章中构建连贯的证据块,并使用LoRA微调多语言大语言模型,在宏观F1分数上相比基线提升了高达20%。

0 人收藏 0 人点赞
#fact-verification

证据缺失并非证据不足:事实核查中NEI构建伪影的诊断

arXiv cs.CL · 2026-05-27 缓存

本文介绍了NEI-CAP,一种用于评估事实核查基准中“信息不足”示例构建方式的诊断协议,揭示了在易于取巧的NEI构建上训练的模型无法迁移到更难的、语义相关的信息不足案例上。

0 人收藏 0 人点赞
#fact-verification

人类如何处理AI生成的幻觉内容:一项神经影像学研究

arXiv cs.AI · 2026-05-19 缓存

本文利用脑电图记录研究人类处理AI生成的幻觉内容时的神经动力学,揭示了错误判断与正确判断幻觉之间的不同认知模式及差异。

0 人收藏 0 人点赞
#fact-verification

辩论未言之隐:角色锚定的多智能体推理检测半真半假

arXiv cs.CL · 2026-04-22 缓存

RADAR 提出角色锚定的多智能体辩论框架,让“政客”与“科学家”智能体在证据上对抗推理,识别因遗漏语境而具误导性的半真半假,在 omission-aware 事实验证上全面超越基线。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈