RadAgent:用于胸部CT逐步解读的工具型AI代理

Hugging Face Daily Papers 论文

摘要

RadAgent是一种使用工具的AI代理,通过可解释的逐步推理生成胸部CT报告,将临床准确率相对提升36.4%,并实现37%的忠实度——这是现有3D视觉语言模型所不具备的能力。该系统提供完全可检查的推理轨迹,使临床医生能够验证和优化诊断输出。

视觉语言模型(VLM)显著推动了人工智能对复杂医学影像(如计算机断层扫描CT)的解释和报告生成。然而,现有方法大多将临床医生降级为最终结果的被动观察者,不提供可解释的推理轨迹供其检查、验证或优化。为解决这一问题,我们引入了RadAgent,一种使用工具的AI代理,通过逐步且可解释的过程生成CT报告。每个生成的报告都附带完整的中间决策和工具交互轨迹,供临床医生检查报告发现是如何得出的。在我们的实验中,我们观察到RadAgent在三个维度上改进了胸部CT报告生成,优于其3D VLM对应模型CT-Chat。临床准确率在宏F1上提升了6.0分(相对提升36.4%),在微F1上提升了5.4分(相对提升19.6%)。在对抗性条件下的鲁棒性提升了24.7分(相对提升41.9%)。此外,RadAgent在忠实度上达到37.0%,这是其3D VLM对应模型完全不具备的新能力。通过将胸部CT解读构建为显式、工具增强且迭代的推理轨迹,RadAgent使我们更接近透明且可靠的放射学AI。
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/04/20 08:27

论文页面 - RadAgent: 一种使用工具的人工智能代理,用于胸部CT的逐步解释

来源:https://huggingface.co/papers/2604.15231

摘要

RadAgent,一种使用工具的人工智能代理,通过可解释的逐步推理轨迹增强胸部CT报告生成,相比现有的3D视觉语言模型,提高了临床准确性、鲁棒性和忠实度。

视觉语言模型(https://huggingface.co/papers?q=Vision-language%20models)(VLM)显著推动了AI驱动的复杂医学影像(如计算机断层扫描(CT))的解释与报告生成。然而,现有方法大多将临床医生限制为最终输出的被动观察者,未提供可检查、验证或优化的可解释推理轨迹(https://huggingface.co/papers?q=reasoning%20trace)。为了解决这一问题,我们引入了RadAgent,一种使用工具的人工智能代理(https://huggingface.co/papers?q=tool-using%20AI%20agent),通过逐步且可解释的过程生成CT报告(https://huggingface.co/papers?q=CT%20reports)。每个生成的报告都附带一个完全可检查的中间决策和工具交互轨迹,使临床医生能够检查报告结果的推导过程。在我们的实验中,我们观察到RadAgent在三个维度上优于其3D VLM对应物CT-Chat,从而改进了胸部CT报告生成。临床准确性(https://huggingface.co/papers?q=Clinical%20accuracy)在宏观F1上提升了6.0分(相对提升36.4%),在微观F1上提升了5.4分(相对提升19.6%)。在对抗条件下的鲁棒性(https://huggingface.co/papers?q=Robustness)提升了24.7分(相对提升41.9%)。此外,RadAgent在忠实度(https://huggingface.co/papers?q=faithfulness)上达到37.0%,这是一项在其3D VLM对应物中完全不存在的新能力。通过将胸部CT解释构建为显式的、工具增强且迭代的推理轨迹(https://huggingface.co/papers?q=reasoning%20trace),RadAgent使我们离透明且可靠的放射学AI更近一步。

查看arXiv页面 (https://arxiv.org/abs/2604.15231)查看PDF (https://arxiv.org/pdf/2604.15231)项目页面 (https://rad-agent.github.io/)添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2604.15231)

在你的代理中获取此论文:

hf papers read 2604\.15231

没有最新的CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型1

RadAgent/radagent-qwen3-14b-lora 文本生成• 3天前更新 • 66 • 3 (https://huggingface.co/RadAgent/radagent-qwen3-14b-lora)

引用此论文的数据集0

没有链接此论文的数据集

在数据集的README.md中引用arxiv.org/abs/2604.15231,以从此页面链接。

引用此论文的空间0

没有链接此论文的空间

在空间的README.md中引用arxiv.org/abs/2604.15231,以从此页面链接。

包含此论文的收藏0

没有包含此论文的收藏

将此论文添加到一个收藏 (https://huggingface.co/new-collection) 中,以从此页面链接。

相似文章

推出 AgentKit、新的 Evals 和用于代理的 RFT

OpenAI Blog

OpenAI 推出了 AgentKit,这是一套用于构建、部署和优化代理的综合工具套件,包括可视化 Agent Builder、用于企业数据管理的 Connector Registry,以及扩展的评估功能,包括新数据集和自动提示优化功能。

迈向虚拟细胞中的自主机制推理

Hugging Face Daily Papers

本文介绍了VCR-Agent,一个多智能体框架,通过结构化形式化和VC-TRACES数据集生成并验证机制性解释,从而增强大型语言模型在生物学研究中的应用。该方法通过虚拟细胞中的验证性机制推理,提高了基因表达预测的事实准确性。

使用 GPT-4o 推理能力改革癌症护理

OpenAI Blog

Color Health 开发了一款利用 GPT-4o 推理能力的 AI 医学助手,帮助肿瘤学家识别缺失的诊断信息并优化癌症护理工作流程。该工具使医生能够在约 5 分钟内发现 4 倍多的缺失检验和成像结果,相比之前需要数周,目前正在旧金山加州大学进行初步验证。

Agent Context

Product Hunt

Agent Context 是一款开发者工具,可让用户将参考项目附加到 AI 编程助手。