可配置临床信息提取与Agentic RAG:有效、失效及原因分析

Hugging Face Daily Papers 论文

摘要

ACIE是一款用于临床信息提取的智能体RAG系统,在核医学医师对7,326个实例的判断中达到96.5%的接受率,解决了异质性患者背景和缺失元数据的挑战。

患者背景涵盖数百份异质性文档和数千个结构化数据点,但AI系统进行检索和分类所需的文档级元数据缺失或不完整。标准的检索增强生成在处理这些数据时失败,无法正确处理时间推理、跨文档依赖和缺失元数据。我们在埃森大学医学中心部署了ACIE(智能体临床信息提取):一个本地部署的智能体RAG管道,它可以推理完整的患者背景,并将每个答案基于源段落以便临床医生验证。我们量化了元数据差距,追溯了它导致的架构决策,并与一项独立的回顾性淋巴瘤登记研究一起评估提取效果,在该研究中,核医学医师根据引用的来源验证每个提取值。在7,326个判断中,临床医生接受了96.5\%的提取结果,各类别的接受率从80\%到99\%不等。
查看原文
查看缓存全文

缓存时间: 2026/06/20 14:26

论文页面 - 基于智能体RAG的可配置临床信息提取:什么有效、什么出错、原因何在

来源:https://huggingface.co/papers/2606.19602

摘要

ACIE 是一个部署在临床环境中的智能体RAG系统,在从复杂的患者病历中提取医学信息时展现出高准确性,在7,326次判断中获得了核医学医师96.5%的接受率。

患者病历(https://huggingface.co/papers?q=Patient%20contexts)涵盖数百份异构文档和数千个结构化数据点,然而AI系统进行检索和分类所需的文档级元数据要么缺失,要么不完整。标准检索增强生成(https://huggingface.co/papers?q=retrieval-augmented%20generation)无法处理此类数据,在时间推理、跨文档依赖关系和缺失元数据方面表现不佳。我们在埃森大学医学中心部署了ACIE(智能体临床信息提取(https://huggingface.co/papers?q=Clinical%20Information%20Extraction)):一个本地化的智能体RAG流水线(https://huggingface.co/papers?q=agentic%20RAG%20pipeline),能对完整患者病历(https://huggingface.co/papers?q=patient%20contexts)进行推理,并将每个答案基于源文本段(https://huggingface.co/papers?q=source%20passages)以供临床医师验证(https://huggingface.co/papers?q=clinician%20verification)。我们量化了元数据差距,追溯了由此形成的架构决策,并与一项独立的回顾性淋巴瘤登记研究(https://huggingface.co/papers?q=lymphoma%20registry%20study)并行评估了提取效果——在该研究中,核医学医师(https://huggingface.co/papers?q=nuclear-medicine%20physicians)对照所引用的来源逐一验证每个提取值。在7,326次判断中,临床医师接受了96.5%的提取结果,按类型划分的接受率介于80%至99%之间。

查看arXiv页面(https://arxiv.org/abs/2606.19602)查看PDF(https://arxiv.org/pdf/2606.19602)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2606.19602)

在你的智能体中获取此论文:

hf papers read 2606.19602

没有最新的CLI?curl -LsSf https://hf.co/cli/install.sh | bash

引用此论文的模型0

无模型链接此论文

在模型README.md中引用 arxiv.org/abs/2606.19602 即可从本页面链接。

引用此论文的数据集0

无数据集链接此论文

在数据集README.md中引用 arxiv.org/abs/2606.19602 即可从本页面链接。

引用此论文的Spaces0

无Space链接此论文

在Space的README.md中引用 arxiv.org/abs/2606.19602 即可从本页面链接。

包含此论文的收藏集0

未包含此论文的收藏集

将此论文添加到一个收藏集(https://huggingface.co/new-collection)中即可从本页面链接。

相似文章

AgenticRAG:面向企业知识库的代理检索

arXiv cs.AI

本文介绍了 AgenticRAG,这是一个来自微软的框架,通过为大型语言模型(LLM)配备迭代搜索、文档导航和分析工具,增强了企业知识库的检索能力。它在多个基准测试中展示了相比标准 RAG 流水线在召回率和事实准确性方面的显著提升。

用于模式约束临床信息抽取的检索增强型大语言模型

arXiv cs.CL

本文提出了一种模块化的检索增强生成(RAG)流水线,用于从护理人员与患者的对话转录中提取结构化临床观察结果,采用模式约束提示和第二遍审核,基于Llama和GPT骨干模型,取得了80.36%的F1分数。

Agentic Document Extraction

Product Hunt

Agentic Document Extraction 是一款利用AI智能体从非结构化文档中提取结构化数据,使文档变得可计算化的工具。