@VikParuchuri: OCR幻觉会污染下游工作流。我们构建了研究驱动的防护措施，将幻觉减少到接近…

X AI KOLs Following 2026/07/02 14:54 工具

ocr hallucinations safeguards benchmark word-level confidence-scores

摘要

Vik Paruchuri宣布了研究驱动的防护措施，在其基准测试中将OCR幻觉降至接近零，并为任何残留错误提供单词级边界框和置信度分数。

OCR幻觉会污染下游工作流。我们构建了研究驱动的防护措施，在我们的基准测试中将幻觉降至接近零。而且，我们的单词级边界框和置信度分数让你可以检查任何可能漏过的幻觉。https://t.co/MFFm332OaH

查看原文

查看缓存全文

缓存时间: 2026/07/02 16:26

OCR幻觉会污染下游工作流。

我们构建了基于研究的防护措施，在我们的基准测试中将幻觉降至接近零。同时，我们的词级边界框和置信度分数让你能够检查任何可能漏网的幻觉。https://t.co/MFFm332OaH

相似文章

arXiv cs.CL

本文介绍了一个统一的基准，用于RAG系统中的跨度级幻觉检测，该基准超越了自然语言，扩展到代码、工具输出和结构化文档，并展示了一个微调的Qwen3.5-2B检测器，该检测器在这些新领域上优于现有方法，同时在标准NLP基准上保持竞争力。

X AI KOLs Timeline

仅 1.7B 参数的多语言文档解析器 dots.ocr，用轻量体积实现 SOTA，证明文档理解无需巨无霸模型。

arXiv cs.CL

本文揭示了LLM幻觉检测领域报道的许多进展实际上源于基准构建伪影，其中真实答案被嵌入到提示中，使得简单的文本相似度基线方法能够获得近乎完美的分数。通过大规模受控评估，作者证明，在适当控制下，大多数方法的表现接近随机水平，除了对上层隐藏状态的监督探针（如SAPLMA）以及他们提出的DRIFT。

arXiv cs.CL

本文提出了Grounded Optimization，一个五层框架，用于减少自动个人文档重写中的LLM幻觉。实验表明，在各种模型和温度设置下，幻觉率显著降低。

Reddit r/AI_Agents

一位创始人宣布推出Check，这是一个面向AI智能体的SaaS反幻觉层，可将幻觉减少至少50%，并声称它能释放AI的真正能力。