可配置临床信息提取与Agentic RAG：有效、失效及原因分析

Hugging Face Daily Papers 2026/06/17 00:00 论文

摘要

ACIE是一款用于临床信息提取的智能体RAG系统，在核医学医师对7,326个实例的判断中达到96.5%的接受率，解决了异质性患者背景和缺失元数据的挑战。

患者背景涵盖数百份异质性文档和数千个结构化数据点，但AI系统进行检索和分类所需的文档级元数据缺失或不完整。标准的检索增强生成在处理这些数据时失败，无法正确处理时间推理、跨文档依赖和缺失元数据。我们在埃森大学医学中心部署了ACIE（智能体临床信息提取）：一个本地部署的智能体RAG管道，它可以推理完整的患者背景，并将每个答案基于源段落以便临床医生验证。我们量化了元数据差距，追溯了它导致的架构决策，并与一项独立的回顾性淋巴瘤登记研究一起评估提取效果，在该研究中，核医学医师根据引用的来源验证每个提取值。在7,326个判断中，临床医生接受了96.5\%的提取结果，各类别的接受率从80\%到99\%不等。

查看原文

查看缓存全文

缓存时间: 2026/06/20 14:26

论文页面 - 基于智能体RAG的可配置临床信息提取：什么有效、什么出错、原因何在

来源：https://huggingface.co/papers/2606.19602

摘要

ACIE 是一个部署在临床环境中的智能体RAG系统，在从复杂的患者病历中提取医学信息时展现出高准确性，在7,326次判断中获得了核医学医师96.5%的接受率。

患者病历（https://huggingface.co/papers?q=Patient%20contexts）涵盖数百份异构文档和数千个结构化数据点，然而AI系统进行检索和分类所需的文档级元数据要么缺失，要么不完整。标准检索增强生成（https://huggingface.co/papers?q=retrieval-augmented%20generation）无法处理此类数据，在时间推理、跨文档依赖关系和缺失元数据方面表现不佳。我们在埃森大学医学中心部署了ACIE（智能体临床信息提取（https://huggingface.co/papers?q=Clinical%20Information%20Extraction））：一个本地化的智能体RAG流水线（https://huggingface.co/papers?q=agentic%20RAG%20pipeline），能对完整患者病历（https://huggingface.co/papers?q=patient%20contexts）进行推理，并将每个答案基于源文本段（https://huggingface.co/papers?q=source%20passages）以供临床医师验证（https://huggingface.co/papers?q=clinician%20verification）。我们量化了元数据差距，追溯了由此形成的架构决策，并与一项独立的回顾性淋巴瘤登记研究（https://huggingface.co/papers?q=lymphoma%20registry%20study）并行评估了提取效果——在该研究中，核医学医师（https://huggingface.co/papers?q=nuclear-medicine%20physicians）对照所引用的来源逐一验证每个提取值。在7,326次判断中，临床医师接受了96.5%的提取结果，按类型划分的接受率介于80%至99%之间。

查看arXiv页面（https://arxiv.org/abs/2606.19602）查看PDF（https://arxiv.org/pdf/2606.19602）添加到收藏（https://huggingface.co/login?next=%2Fpapers%2F2606.19602）

在你的智能体中获取此论文：

hf papers read 2606.19602

没有最新的CLI？curl -LsSf https://hf.co/cli/install.sh | bash

引用此论文的模型0

无模型链接此论文

在模型README.md中引用 arxiv.org/abs/2606.19602 即可从本页面链接。

引用此论文的数据集0

无数据集链接此论文

在数据集README.md中引用 arxiv.org/abs/2606.19602 即可从本页面链接。

引用此论文的Spaces0

无Space链接此论文

在Space的README.md中引用 arxiv.org/abs/2606.19602 即可从本页面链接。

包含此论文的收藏集0

未包含此论文的收藏集

将此论文添加到一个收藏集（https://huggingface.co/new-collection）中即可从本页面链接。

可配置临床信息提取与Agentic RAG：有效、失效及原因分析

论文页面 - 基于智能体RAG的可配置临床信息提取：什么有效、什么出错、原因何在

摘要

引用此论文的模型0

引用此论文的数据集0

引用此论文的Spaces0

包含此论文的收藏集0

相似文章

AgenticRAG：面向企业知识库的代理检索

用于改进临床试验工作流程准确性和效率的AI辅助协议信息提取

SEMA-RAG：一种用于医学推理的自进化多智能体检索增强生成框架

用于模式约束临床信息抽取的检索增强型大语言模型

Agentic Document Extraction

提交意见反馈