RadAgent:用于胸部CT逐步解读的工具型AI代理
摘要
RadAgent是一种使用工具的AI代理,通过可解释的逐步推理生成胸部CT报告,将临床准确率相对提升36.4%,并实现37%的忠实度——这是现有3D视觉语言模型所不具备的能力。该系统提供完全可检查的推理轨迹,使临床医生能够验证和优化诊断输出。
查看缓存全文
缓存时间: 2026/04/20 08:27
论文页面 - RadAgent: 一种使用工具的人工智能代理,用于胸部CT的逐步解释
来源:https://huggingface.co/papers/2604.15231
摘要
RadAgent,一种使用工具的人工智能代理,通过可解释的逐步推理轨迹增强胸部CT报告生成,相比现有的3D视觉语言模型,提高了临床准确性、鲁棒性和忠实度。
视觉语言模型(https://huggingface.co/papers?q=Vision-language%20models)(VLM)显著推动了AI驱动的复杂医学影像(如计算机断层扫描(CT))的解释与报告生成。然而,现有方法大多将临床医生限制为最终输出的被动观察者,未提供可检查、验证或优化的可解释推理轨迹(https://huggingface.co/papers?q=reasoning%20trace)。为了解决这一问题,我们引入了RadAgent,一种使用工具的人工智能代理(https://huggingface.co/papers?q=tool-using%20AI%20agent),通过逐步且可解释的过程生成CT报告(https://huggingface.co/papers?q=CT%20reports)。每个生成的报告都附带一个完全可检查的中间决策和工具交互轨迹,使临床医生能够检查报告结果的推导过程。在我们的实验中,我们观察到RadAgent在三个维度上优于其3D VLM对应物CT-Chat,从而改进了胸部CT报告生成。临床准确性(https://huggingface.co/papers?q=Clinical%20accuracy)在宏观F1上提升了6.0分(相对提升36.4%),在微观F1上提升了5.4分(相对提升19.6%)。在对抗条件下的鲁棒性(https://huggingface.co/papers?q=Robustness)提升了24.7分(相对提升41.9%)。此外,RadAgent在忠实度(https://huggingface.co/papers?q=faithfulness)上达到37.0%,这是一项在其3D VLM对应物中完全不存在的新能力。通过将胸部CT解释构建为显式的、工具增强且迭代的推理轨迹(https://huggingface.co/papers?q=reasoning%20trace),RadAgent使我们离透明且可靠的放射学AI更近一步。
查看arXiv页面 (https://arxiv.org/abs/2604.15231)查看PDF (https://arxiv.org/pdf/2604.15231)项目页面 (https://rad-agent.github.io/)添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2604.15231)
在你的代理中获取此论文:
hf papers read 2604\.15231
没有最新的CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用此论文的模型1
RadAgent/radagent-qwen3-14b-lora 文本生成• 3天前更新 • 66 • 3 (https://huggingface.co/RadAgent/radagent-qwen3-14b-lora)
引用此论文的数据集0
没有链接此论文的数据集
在数据集的README.md中引用arxiv.org/abs/2604.15231,以从此页面链接。
引用此论文的空间0
没有链接此论文的空间
在空间的README.md中引用arxiv.org/abs/2604.15231,以从此页面链接。
包含此论文的收藏0
没有包含此论文的收藏
将此论文添加到一个收藏 (https://huggingface.co/new-collection) 中,以从此页面链接。
相似文章
一种专门用于加速罕见病诊断的推理型大型语言模型:一项随机AI医生辅助试验
本文介绍了RaDaR,一个320亿参数的开源推理型大语言模型,基于公开和合成的罕见病病例进行训练。在诊断基准测试中,其表现优于DeepSeek-R1等更大模型,并在随机试验中将医生诊断准确率提升了21.44个百分点。
AgentX - AI Agent 评估框架
AgentX 是一个 AI Agent 评估框架,帮助定位问题并一键修复。
AgentRail
AgentRail 是AI编码代理的本地控制平面,为AI辅助编码工作流提供管理和编排。
技能增强型AI代理在医学研究分析中的应用:一项NSCLC转录组生物标志物任务中的探索性多模型人类评估
本探索性研究在NSCLC生物标志物任务中使用多模型人类评估,评估将AI代理与医学研究技能包相结合是否能提高转录组研究分析输出的质量(与原生AI相比)。结果显示有方向性但无统计显著性的改善,强调了进行更大规模、更稳健评估的必要性。
可配置临床信息提取与Agentic RAG:有效、失效及原因分析
ACIE是一款用于临床信息提取的智能体RAG系统,在核医学医师对7,326个实例的判断中达到96.5%的接受率,解决了异质性患者背景和缺失元数据的挑战。