RadAgent:用于胸部CT逐步解读的工具型AI代理

Hugging Face Daily Papers 论文

摘要

RadAgent是一种使用工具的AI代理,通过可解释的逐步推理生成胸部CT报告,将临床准确率相对提升36.4%,并实现37%的忠实度——这是现有3D视觉语言模型所不具备的能力。该系统提供完全可检查的推理轨迹,使临床医生能够验证和优化诊断输出。

视觉语言模型(VLM)显著推动了人工智能对复杂医学影像(如计算机断层扫描CT)的解释和报告生成。然而,现有方法大多将临床医生降级为最终结果的被动观察者,不提供可解释的推理轨迹供其检查、验证或优化。为解决这一问题,我们引入了RadAgent,一种使用工具的AI代理,通过逐步且可解释的过程生成CT报告。每个生成的报告都附带完整的中间决策和工具交互轨迹,供临床医生检查报告发现是如何得出的。在我们的实验中,我们观察到RadAgent在三个维度上改进了胸部CT报告生成,优于其3D VLM对应模型CT-Chat。临床准确率在宏F1上提升了6.0分(相对提升36.4%),在微F1上提升了5.4分(相对提升19.6%)。在对抗性条件下的鲁棒性提升了24.7分(相对提升41.9%)。此外,RadAgent在忠实度上达到37.0%,这是其3D VLM对应模型完全不具备的新能力。通过将胸部CT解读构建为显式、工具增强且迭代的推理轨迹,RadAgent使我们更接近透明且可靠的放射学AI。
查看原文
查看缓存全文

缓存时间: 2026/04/20 08:27

论文页面 - RadAgent: 一种使用工具的人工智能代理,用于胸部CT的逐步解释

来源:https://huggingface.co/papers/2604.15231

摘要

RadAgent,一种使用工具的人工智能代理,通过可解释的逐步推理轨迹增强胸部CT报告生成,相比现有的3D视觉语言模型,提高了临床准确性、鲁棒性和忠实度。

视觉语言模型(https://huggingface.co/papers?q=Vision-language%20models)(VLM)显著推动了AI驱动的复杂医学影像(如计算机断层扫描(CT))的解释与报告生成。然而,现有方法大多将临床医生限制为最终输出的被动观察者,未提供可检查、验证或优化的可解释推理轨迹(https://huggingface.co/papers?q=reasoning%20trace)。为了解决这一问题,我们引入了RadAgent,一种使用工具的人工智能代理(https://huggingface.co/papers?q=tool-using%20AI%20agent),通过逐步且可解释的过程生成CT报告(https://huggingface.co/papers?q=CT%20reports)。每个生成的报告都附带一个完全可检查的中间决策和工具交互轨迹,使临床医生能够检查报告结果的推导过程。在我们的实验中,我们观察到RadAgent在三个维度上优于其3D VLM对应物CT-Chat,从而改进了胸部CT报告生成。临床准确性(https://huggingface.co/papers?q=Clinical%20accuracy)在宏观F1上提升了6.0分(相对提升36.4%),在微观F1上提升了5.4分(相对提升19.6%)。在对抗条件下的鲁棒性(https://huggingface.co/papers?q=Robustness)提升了24.7分(相对提升41.9%)。此外,RadAgent在忠实度(https://huggingface.co/papers?q=faithfulness)上达到37.0%,这是一项在其3D VLM对应物中完全不存在的新能力。通过将胸部CT解释构建为显式的、工具增强且迭代的推理轨迹(https://huggingface.co/papers?q=reasoning%20trace),RadAgent使我们离透明且可靠的放射学AI更近一步。

查看arXiv页面 (https://arxiv.org/abs/2604.15231)查看PDF (https://arxiv.org/pdf/2604.15231)项目页面 (https://rad-agent.github.io/)添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2604.15231)

在你的代理中获取此论文:

hf papers read 2604\.15231

没有最新的CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型1

RadAgent/radagent-qwen3-14b-lora 文本生成• 3天前更新 • 66 • 3 (https://huggingface.co/RadAgent/radagent-qwen3-14b-lora)

引用此论文的数据集0

没有链接此论文的数据集

在数据集的README.md中引用arxiv.org/abs/2604.15231,以从此页面链接。

引用此论文的空间0

没有链接此论文的空间

在空间的README.md中引用arxiv.org/abs/2604.15231,以从此页面链接。

包含此论文的收藏0

没有包含此论文的收藏

将此论文添加到一个收藏 (https://huggingface.co/new-collection) 中,以从此页面链接。

相似文章

AgentRail

Product Hunt

AgentRail 是AI编码代理的本地控制平面,为AI辅助编码工作流提供管理和编排。