RadAgent：用于胸部CT逐步解读的工具型AI代理

Hugging Face Daily Papers 2026/04/16 00:00 论文

摘要

RadAgent是一种使用工具的AI代理，通过可解释的逐步推理生成胸部CT报告，将临床准确率相对提升36.4%，并实现37%的忠实度——这是现有3D视觉语言模型所不具备的能力。该系统提供完全可检查的推理轨迹，使临床医生能够验证和优化诊断输出。

视觉语言模型（VLM）显著推动了人工智能对复杂医学影像（如计算机断层扫描CT）的解释和报告生成。然而，现有方法大多将临床医生降级为最终结果的被动观察者，不提供可解释的推理轨迹供其检查、验证或优化。为解决这一问题，我们引入了RadAgent，一种使用工具的AI代理，通过逐步且可解释的过程生成CT报告。每个生成的报告都附带完整的中间决策和工具交互轨迹，供临床医生检查报告发现是如何得出的。在我们的实验中，我们观察到RadAgent在三个维度上改进了胸部CT报告生成，优于其3D VLM对应模型CT-Chat。临床准确率在宏F1上提升了6.0分（相对提升36.4%），在微F1上提升了5.4分（相对提升19.6%）。在对抗性条件下的鲁棒性提升了24.7分（相对提升41.9%）。此外，RadAgent在忠实度上达到37.0%，这是其3D VLM对应模型完全不具备的新能力。通过将胸部CT解读构建为显式、工具增强且迭代的推理轨迹，RadAgent使我们更接近透明且可靠的放射学AI。

查看原文

查看缓存全文

缓存时间: 2026/04/20 08:27

论文页面 - RadAgent: 一种使用工具的人工智能代理，用于胸部CT的逐步解释

来源：https://huggingface.co/papers/2604.15231

摘要

RadAgent，一种使用工具的人工智能代理，通过可解释的逐步推理轨迹增强胸部CT报告生成，相比现有的3D视觉语言模型，提高了临床准确性、鲁棒性和忠实度。

视觉语言模型（https://huggingface.co/papers?q=Vision-language%20models）（VLM）显著推动了AI驱动的复杂医学影像（如计算机断层扫描（CT））的解释与报告生成。然而，现有方法大多将临床医生限制为最终输出的被动观察者，未提供可检查、验证或优化的可解释推理轨迹（https://huggingface.co/papers?q=reasoning%20trace）。为了解决这一问题，我们引入了RadAgent，一种使用工具的人工智能代理（https://huggingface.co/papers?q=tool-using%20AI%20agent），通过逐步且可解释的过程生成CT报告（https://huggingface.co/papers?q=CT%20reports）。每个生成的报告都附带一个完全可检查的中间决策和工具交互轨迹，使临床医生能够检查报告结果的推导过程。在我们的实验中，我们观察到RadAgent在三个维度上优于其3D VLM对应物CT-Chat，从而改进了胸部CT报告生成。临床准确性（https://huggingface.co/papers?q=Clinical%20accuracy）在宏观F1上提升了6.0分（相对提升36.4%），在微观F1上提升了5.4分（相对提升19.6%）。在对抗条件下的鲁棒性（https://huggingface.co/papers?q=Robustness）提升了24.7分（相对提升41.9%）。此外，RadAgent在忠实度（https://huggingface.co/papers?q=faithfulness）上达到37.0%，这是一项在其3D VLM对应物中完全不存在的新能力。通过将胸部CT解释构建为显式的、工具增强且迭代的推理轨迹（https://huggingface.co/papers?q=reasoning%20trace），RadAgent使我们离透明且可靠的放射学AI更近一步。

查看arXiv页面 (https://arxiv.org/abs/2604.15231)查看PDF (https://arxiv.org/pdf/2604.15231)项目页面 (https://rad-agent.github.io/)添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2604.15231)

在你的代理中获取此论文：

hf papers read 2604\.15231

没有最新的CLI？curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型1

RadAgent/radagent-qwen3-14b-lora 文本生成• 3天前更新 • 66 • 3 (https://huggingface.co/RadAgent/radagent-qwen3-14b-lora)

引用此论文的数据集0

没有链接此论文的数据集

在数据集的README.md中引用arxiv.org/abs/2604.15231，以从此页面链接。

引用此论文的空间0

没有链接此论文的空间

在空间的README.md中引用arxiv.org/abs/2604.15231，以从此页面链接。

包含此论文的收藏0

没有包含此论文的收藏

将此论文添加到一个收藏 (https://huggingface.co/new-collection) 中，以从此页面链接。

RadAgent：用于胸部CT逐步解读的工具型AI代理

论文页面 - RadAgent: 一种使用工具的人工智能代理，用于胸部CT的逐步解释

摘要

引用此论文的模型1

RadAgent/radagent-qwen3-14b-lora 文本生成• 3天前更新 • 66 • 3 (https://huggingface.co/RadAgent/radagent-qwen3-14b-lora)

引用此论文的数据集0

引用此论文的空间0

包含此论文的收藏0

相似文章

一种专门用于加速罕见病诊断的推理型大型语言模型：一项随机AI医生辅助试验

AgentX - AI Agent 评估框架

AgentRail

技能增强型AI代理在医学研究分析中的应用：一项NSCLC转录组生物标志物任务中的探索性多模型人类评估

可配置临床信息提取与Agentic RAG：有效、失效及原因分析

提交意见反馈