可配置临床信息提取与Agentic RAG:有效、失效及原因分析
摘要
ACIE是一款用于临床信息提取的智能体RAG系统,在核医学医师对7,326个实例的判断中达到96.5%的接受率,解决了异质性患者背景和缺失元数据的挑战。
查看缓存全文
缓存时间: 2026/06/20 14:26
论文页面 - 基于智能体RAG的可配置临床信息提取:什么有效、什么出错、原因何在
来源:https://huggingface.co/papers/2606.19602
摘要
ACIE 是一个部署在临床环境中的智能体RAG系统,在从复杂的患者病历中提取医学信息时展现出高准确性,在7,326次判断中获得了核医学医师96.5%的接受率。
患者病历(https://huggingface.co/papers?q=Patient%20contexts)涵盖数百份异构文档和数千个结构化数据点,然而AI系统进行检索和分类所需的文档级元数据要么缺失,要么不完整。标准检索增强生成(https://huggingface.co/papers?q=retrieval-augmented%20generation)无法处理此类数据,在时间推理、跨文档依赖关系和缺失元数据方面表现不佳。我们在埃森大学医学中心部署了ACIE(智能体临床信息提取(https://huggingface.co/papers?q=Clinical%20Information%20Extraction)):一个本地化的智能体RAG流水线(https://huggingface.co/papers?q=agentic%20RAG%20pipeline),能对完整患者病历(https://huggingface.co/papers?q=patient%20contexts)进行推理,并将每个答案基于源文本段(https://huggingface.co/papers?q=source%20passages)以供临床医师验证(https://huggingface.co/papers?q=clinician%20verification)。我们量化了元数据差距,追溯了由此形成的架构决策,并与一项独立的回顾性淋巴瘤登记研究(https://huggingface.co/papers?q=lymphoma%20registry%20study)并行评估了提取效果——在该研究中,核医学医师(https://huggingface.co/papers?q=nuclear-medicine%20physicians)对照所引用的来源逐一验证每个提取值。在7,326次判断中,临床医师接受了96.5%的提取结果,按类型划分的接受率介于80%至99%之间。
查看arXiv页面(https://arxiv.org/abs/2606.19602)查看PDF(https://arxiv.org/pdf/2606.19602)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2606.19602)
在你的智能体中获取此论文:
hf papers read 2606.19602
没有最新的CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用此论文的模型0
无模型链接此论文
在模型README.md中引用 arxiv.org/abs/2606.19602 即可从本页面链接。
引用此论文的数据集0
无数据集链接此论文
在数据集README.md中引用 arxiv.org/abs/2606.19602 即可从本页面链接。
引用此论文的Spaces0
无Space链接此论文
在Space的README.md中引用 arxiv.org/abs/2606.19602 即可从本页面链接。
包含此论文的收藏集0
未包含此论文的收藏集
将此论文添加到一个收藏集(https://huggingface.co/new-collection)中即可从本页面链接。
相似文章
AgenticRAG:面向企业知识库的代理检索
本文介绍了 AgenticRAG,这是一个来自微软的框架,通过为大型语言模型(LLM)配备迭代搜索、文档导航和分析工具,增强了企业知识库的检索能力。它在多个基准测试中展示了相比标准 RAG 流水线在召回率和事实准确性方面的显著提升。
用于改进临床试验工作流程准确性和效率的AI辅助协议信息提取
Banting Health AI的研究人员展示了一个利用生成式大语言模型和检索增强生成(RAG)技术进行临床试验协议信息自动提取的AI系统,准确率达89%,相比独立LLM的62.6%有显著提升,AI辅助工作流程任务完成速度快40%,并降低认知负荷。
SEMA-RAG:一种用于医学推理的自进化多智能体检索增强生成框架
SEMA-RAG是一种自进化多智能体RAG框架,用于医学问答,它将解读、探索和裁决解耦为三个专业智能体,在多个基准测试中相较于基线取得了显著的准确率提升。
用于模式约束临床信息抽取的检索增强型大语言模型
本文提出了一种模块化的检索增强生成(RAG)流水线,用于从护理人员与患者的对话转录中提取结构化临床观察结果,采用模式约束提示和第二遍审核,基于Llama和GPT骨干模型,取得了80.36%的F1分数。
Agentic Document Extraction
Agentic Document Extraction 是一款利用AI智能体从非结构化文档中提取结构化数据,使文档变得可计算化的工具。