迈向Vibe医学:一种用于临床决策支持的自进化多智能体框架
摘要
本文提出了VIBEMed,一种具有自进化机制和安全沙箱的多智能体框架,用于稳健的临床决策支持,集成了专门用于诊断、治疗计划以及随时间演化临床知识的智能体。
arXiv:2606.15504v1 Announce Type: new
摘要:近年来,大型语言模型和自主智能体的进步彻底改变了医疗保健领域,促进了诊断并改善了治疗结果。然而,大多数现有AI系统依赖于预训练知识和预定义管道,难以从包含患者结果和过去失败的交互式聊天会话历史中动态学习。为解决这一局限性,我们提出了VIBEMed,一种具有内置自进化机制和架构级安全沙箱的多智能体框架,用于稳健的临床决策支持。该系统集成了三个专门智能体,包括用于假设生成的临床诊断智能体(CDA)、用于治疗计划的治疗执行智能体(TEA)以及用于将纵向临床反馈提炼为可重用知识的临床演化管理智能体(CEMA),将多模态患者信息转化为个性化医疗决策。通过自进化机制,该框架实现了记忆、模型行为和决策策略的迭代更新,使系统能够随时间改进。实验结果表明,VIBEMed通过其进化机制在复杂临床案例中表现出卓越性能,尤其是在需要综合决策和纵向规划的任务中。该框架还支持在肿瘤治疗计划等具有挑战性的场景中进行可靠的端到端决策,突显了其在真实临床环境中的可行性。总体而言,VIBEMed提供了一条超越静态AI系统、迈向自适应、经验驱动的临床决策支持的实用路径,展示了结合多智能体协作与持续进化对推进精准医学的价值。
查看缓存全文
缓存时间: 2026/06/16 11:46
# 走向Vibe医学:一种面向临床决策支持的自进化多智能体框架 来源:https://arxiv.org/html/2606.15504 \\fnmark \[1\] 1\]组织=Medical AI Lab, addressline=河北医科大学第一医院, city=石家庄, postcode=050000, state=河北, country=中国 \\fnmark \[1\] 2\]组织=河北省基于人工智能的癌症治疗决策工程研究中心, addressline=河北医科大学第一医院, city=石家庄, postcode=050000, state=河北, country=中国 3\]组织=神经与肿瘤药物研发全国重点实验室, state=南京, country=中国 4\]组织=School of Computing, University of Georgia, addressline=415 Boyd Research and Education Center, city=Athens, postcode=30602, state=GA, country=USA 5\]组织=Department of Radiation Oncology, National Cancer Center/National Clinical Research Center for Cancer/Cancer Hospital and Shenzhen Hospital, Chinese Academy of Medical Sciences and Peking Union Medical College, city=深圳, country=中国 6\]组织=Department of Radiation Oncology, Mayo Clinic, addressline=5881 E\. Mayo Blvd\., city=Phoenix, postcode=85054, state=AZ, country=USA 7\]组织=College of Mechanical and Power Engineering, China Three Gorges University, city=宜昌, state=湖北, country=中国 8\]组织=Department of Radiation Oncology, Guangzhou Concord Cancer Center, city=广州, state=广东, country=中国 9\]组织=Gastrointestinal Disease Diagnosis and Treatment Center, 河北医科大学第一医院, city=石家庄, postcode=050000, state=河北, country=中国 10\]组织=Department of General Surgery, 河北医科大学第一医院, city=石家庄, postcode=050000, state=河北, country=中国 \\cortext \[cor1\]通讯作者\\fntext\[fn1\]这是第一作者脚注。 Yiming Ren\\[Shihuan Qin\\[Xiao Zhang\\Liao Zhang\\Jinyang Huang\\Zhengliang Liu\\[Chenbin Liu\\[Hongying Feng\\[\\[\\[Jingyuan Chen\\Yuzhen Ding\\Weihang You\\Hanqi Jiang\\Yi Pan\\Yifan Zhou\\Junhao Chen\\Lifeng Chen\\Wei Liu\\Tianming Liu\\tliu@uga\\.edu\\Zengren Zhao\\[\\[zhaozengren@hebmu\\.edu\\.cn\\Lian Zhang\\lianzhang@hebmu\\.edu\\.cn ###### 摘要 近年来,大型语言模型和自主智能体的进步彻底改变了医疗保健领域,有助于诊断并改善治疗结果。然而,现有的大多数AI系统依赖于预训练知识和预定义流水线,难以从包含患者结果和过去失败的交互式聊天会话历史中动态学习。为了解决这一局限性,我们提出了VIBEMed,一个多智能体框架,内置自进化机制和架构级安全沙箱,用于鲁棒的临床决策支持。该系统集成了三个专门的智能体,包括用于假设生成的临床诊断智能体(CDA)、用于治疗计划的治疗执行智能体(TEA)以及临床进化管理智能体(CEMA),该智能体将纵向临床反馈提炼为可重用知识,将多模态患者信息转化为个性化医疗决策。通过自进化机制,该框架实现了在记忆、模型行为和决策策略上的迭代更新,使系统能够随时间改进。实验结果表明,VIBEMed通过其进化机制在复杂临床案例中表现出优越的性能,特别是在需要综合决策和纵向规划的任务中。该框架还支持在具有挑战性的场景(如肿瘤治疗计划)中可靠的端到端决策,突显了其在真实世界临床环境中的可行性。总体而言,VIBEMed为超越静态AI系统、迈向适应性、经验驱动的临床决策支持提供了一条实用路径,展示了将多智能体协作与持续进化相结合对推动精准医学的价值。 ###### 关键词: Vibe Medicine\\sep大型语言模型\\sep多智能体系统\\sep自进化智能体\\sepAI安全 ## 1 引言 人工智能的快速发展正在重新定义计算领域,从传统的自然语言处理(NLP)技术过渡到拥有数万亿参数的大规模模型,同时进一步发展为具有独立思考和任务执行能力的智能体。通过整合意图理解、复杂推理和工具调用,通用大型语言模型(LLMs)和智能体极大地提升了信息处理效率,并在软件开发、科学研究等复杂工作流中展现出卓越的生产力[hou2024large]。从简单的文本生成到多步骤任务规划的进步标志着根本性的转变,人工智能正从被动的工具演变为生产力的主动驱动力。 此外,AI技术和应用已改革了传统的医疗保健领域,使诊断流程受益并优化了行政工作流[thirunavukarasu2023large]。最近的研究表明,多智能体系统和先进模型可以通过自动分割和3D重建有效辅助分析影像报告,通过多模态数据整合支持复杂的临床决策,并通过思维链(CoT)推理和注意力机制实现个性化患者治疗,从而显著提高医疗效率并减轻医疗专业人员的负担[li2025care,peng2024integration]。同时,通过利用智能调度和资源分配工具,医疗管理流程的标准化可以进一步增强。 尽管应用前景广阔,现有的医疗AI系统仍面临关键瓶颈[zheng2025large,kelly2019key]。大多数当前架构严重依赖于静态的预训练权重和预设的执行工作流,其核心能力主要通过离线训练获得,这限制了它们在交互会话期间持续更新的能力[shi2025continual]。尽管现代LLMs可以利用注意力机制[vaswani2017attention]在对话中保留上下文信息,但这种记忆仍然是短期的,无法持续到单个会话之外,也无法导致模型内部参数的更新。因此,模型难以从对话历史、纵向患者预后和先前治疗失败中有效获取和整合新知识,导致在未见过的临床场景中表现不佳。没有基于反馈的持续学习机制,模型被限制在固定的模式匹配中,无法随时间进化。 为了弥补这一知识差距,一些研究引入了检索增强生成(RAG)[lewis2020retrieval]和医学知识图谱,将外部知识整合到LLMs中[singhal2023large]。虽然这些方法改善了对最新医学信息的访问,但在捕捉患者数据中复杂的时间和因果关系方面仍然有限[peng2025graph]。此外,复杂的临床诊断和治疗通常涉及多个步骤和协调决策,传统检索机制无法充分支持。现有方法主要依赖语义相似度或静态图结构,往往产生稀疏或不相关的信息,难以整合成连贯的临床决策。这些局限性凸显了对更结构化、更自适应的框架的需求,以更好地模拟真实世界的临床工作流。 此外,智能医疗应用面临与安全性、隐私和伦理相关的关键挑战[shen2023chatgpt,haltaufderheide2024ethics]。由于医疗数据高度敏感,没有稳健安全措施的完全自动化智能体容易遭受网络攻击和隐私泄露,对受保护的健康信息构成风险[zhong2025considerations]。为了保护患者隐私,建议LLMs部署在隔离的医院本地网络内以确保数据安全,但考虑到可用的开源医学LLMs有限以及患者人口统计学分布和机构特定临床协议的差异,模型在应用于真实世界临床环境时往往表现出性能下降[chen2024integration]。如果没有微调或进化的能力,这种缺乏本地适应性的特点使得在复杂交互中难以确保安全性和临床有效性。 为了克服上述局限性,基于上下文感知和历史记忆的自进化架构已引起越来越多的关注。现有研究引入了氛围编码(vibe coding)[meske2025vibe]和氛围研究(vibe research)[lyu2026evoscientist]的概念,其中智能体可以从简单的提示开始,通过从交互历史和实验结果中学习逐步改进,类似于人类通过经验培养技能。最终,智能体通过自进化成功开发出处理复杂任务的能力[fang2025comprehensive]。受这些进展以及临床实践的经验驱动本质的启发,我们引入了Vibe医学的概念,这是一种医学AI系统范式,系统通过从真实世界交互中学习、积累临床经验并随时间完善其决策,从而持续进化。因此,提出了VIBEMed(Versatile Intelligent Behavior-Evolving Medical framework)作为一个端到端的自进化多智能体系统,无需依赖高质量提示工程或持续人工监督即可实现持续学习。通过引入多角色协作和持久临床记忆机制,它赋予医疗智能体通过交互进行自我纠正和持续进化的能力。本文的核心创新包括以下几个方面: - •一个创新的临床决策多智能体协作框架:所提出的架构由三个专门智能体组成,包括临床诊断智能体、治疗执行智能体和临床进化管理智能体。该框架模拟了真实世界的治疗工作流,实现了从多模态患者数据分析到个性化治疗计划的端到端自动化。 - •一种新颖的三层自进化机制:VIBEMed提出了跨越记忆、模型和代码的自主进化,平衡了快速适应与长期稳定性。在记忆层面,系统将来自历史交互的成功经验和失败案例提炼为持久记忆,用于实时改进。在模型层面,它构建反思数据集并通过监督微调(SFT)和直接偏好优化(DPO)执行阶段性更新,在受控验证下增强LLM的核心能力。在代码层面,框架通过优化智能体交互逻辑和基于用户反馈部署新功能模块来优化其结构。这种统一机制使得无需人工干预即可实现持续且安全的适应。 - •一个用于临床可靠性的架构级安全沙箱:VIBEMed通过系统级约束强制实现安全性,而不是依赖智能体行为或人工监督。该框架采用隔离的执行环境来分离开发、验证和生产阶段,防止未经验证的更新进入临床应用。此外,会话级记忆隔离机制通过所有记忆层级上的作用域访问控制确保患者数据的严格分离。系统操作进一步通过结构化验证、新功能的用户确认以及不可变审计日志来实现可追溯性。这种设计使得自主操作成为可能,同时保持临床环境所需的安全性和可靠性。 ## 2 材料与方法 在本节中,我们介绍VIBEMed框架的详细设计。首先,我们提供全面的系统概述,突出关键构建模块和涉及的机制。接下来,展示多智能体协作网络,然后详细解释三层进化机制。最后,我们介绍旨在确保系统安全可靠运行的架构级安全沙箱。 ### 2.1 系统概述 VIBEMed是一个端到端的的多智能体系统,旨在提供精准的临床决策支持,同时确保安全性并通过交互实现自主改进。基于Vibe医学范式构建,它代表了从静态预定义流水线到动态自改进框架的根本性转变。VIBEMed的整体架构如图1所示(https://arxiv.org/html/2606.15504#S2.F1)。 为了支持复杂的临床工作流和真实世界部署需求,VIBEMed基于三个关键机制构建。首先,多智能体协作框架将临床决策过程分解为专门的角色,实现从诊断到治疗计划的结构化推理,同时保持各阶段之间的协调。其次,三层自进化机制支持在记忆、模型和代码层面的持续改进,允许系统整合新数据、完善能力并随时间扩展功能。第三,架构级安全沙箱通过执行和数据隔离强制执行系统可靠性,确保系统更新和患者交互保持可控和可追溯。 参见图注图1:VIBEMed框架的系统架构,包括多智能体协作框架、三层自进化机制和架构级安全沙箱。 ### 2.2 多智能体协作框架 VIBEMed采用多智能体协作框架,旨在通过专门的角色分配和协调决策模拟真实世界的临床工作流。它解决了单模型架构的根本局限性,这种架构难以在复杂的临床任务中表现出色,而复杂临床任务通常需要从诊断推理到治疗计划的稳健性能。VIBEMed不依赖单一通用模型,而是将临床决策过程分解为三个不同的角色,每个角色由专门的智能体处理。如图2所示(https://arxiv.org/html/2606.15504#S2.F2),三个智能体共享相同的基础大型语言模型,但通过角色特定的系统提示来区分,这些提示指导它们的行为和输出格式。这种设计在专业化和简单性之间取得了平衡,避免了维护多个独立模型的计算开销,同时确保每个智能体在其指定领域发展专业知识。临床诊断智能体、治疗执行智能体和临床进化管理智能体以流水线方式协作运行,将多模态患者数据转化为个性化治疗建议,同时持续从临床经验中学习。 参见图注图2:多智能体协作框架概览。A:临床工作流显示三个智能体(CDA、TEA、CEMA)由共享基础LLM提供动力,并带有角色特定的系统提示。B:每个智能体的示例,显示角色定义及相应的输入与输出。临床诊断智能体:CDA作为en
相似文章
基于上下文Bandit偏好学习的人机协同多智能体呼吸机决策支持
本文提出了VDSS,一种用于呼吸机决策支持的人机协同多智能体框架,它利用上下文Bandit偏好学习来适应特定临床医生的调校风格。回顾性ICU轨迹重放表明,推荐的可接受性提高,交互轮次减少。
OncoAgent:用于保护隐私的肿瘤临床决策支持的双层多智能体框架
本文介绍了 OncoAgent,这是一种专为肿瘤学隐私保护临床决策支持设计的双层多智能体框架。文章详细阐述了结合修正型 RAG、反思安全循环以及针对 AMD 硬件优化的双层 QLoRA 微调的系统架构。
经验造就技能:通过自我演进的技能记忆实现可泛化的医学智能体推理
本文介绍了SkeMex,一个自我演进的框架,通过将交互轨迹提炼为结构化技能记忆来增强医学智能体,并利用上下文相关的效用估计与治理实现更好的长期临床推理。
EvoSci:一种受生物启发的多智能体框架,用于科学发现的演化
EvoSci提出了一种受生物启发的多智能体框架,将进化算法与知识图谱建模相结合,以迭代生成、评估和完善研究想法,在同行评审评估中取得了最佳性能。
SafeRx-Agent:一个基于知识的多智能体框架,用于安全且可解释的药物推荐
介绍了SafeRx-Agent,一种基于知识的多智能体框架,用于安全且可解释的药物推荐,可生成细粒度的ATC代码预测,同时控制药物相互作用和禁忌症,在MIMIC-III和MIMIC-IV数据集上进行了评估。