MedLatentDx:面向跨医院罕见病诊断的潜在多智能体通信框架
摘要
MedLatentDx提出了一种用于跨医院罕见病诊断的潜在多智能体通信框架,利用潜在KV块共享诊断证据而不暴露临床文本,并引入了CrossRare-Bench基准测试。
arXiv:2606.13945v1 Announce Type: new
摘要:罕见病涉及超过7000种疾病,影响超过3亿患者,但没有任何一家医院能遇到足够多的某种病例来进行可靠诊断。跨医院协作可以通过允许诊断机构利用分布式的、针对病例的诊断证据来提供帮助,但隐私法规限制可识别临床文本在机构边界间的传输。这种情况带来了两个挑战:现有的医疗智能体系统通常依赖文本证据交换,而原始的潜在状态(如隐藏状态和KV缓存)仍可能泄露提示衍生的临床内容。我们提出了MedLatentDx,一种潜在多智能体通信框架,其中医院智能体将私有临床记录和检索到的病例保留在本地,并向主智能体发送紧凑的潜在KV块以进行罕见病诊断。MedLatentDx支持两种部署设置:具有相同主干网络的医院智能体使用潜在KV蒸馏,而使用不同LLM主干网络医院则使用跨家族潜在对齐。在CrossRare-Bench(一个自建的大规模罕见病基准测试,具有医院级分区)上,MedLatentDx提高了跨医院诊断性能,同时相对于原始潜在通信基线减少了可重构的临床内容。
查看缓存全文
缓存时间: 2026/06/15 08:57
# MedLatentDx:面向跨医院罕见病诊断的潜在多智能体通信
来源:https://arxiv.org/abs/2606.13945
查看PDF(https://arxiv.org/pdf/2606.13945)
> **摘要:** 罕见病涉及超过 $300$ 万患者,涵盖 $7{,}000$ 多种疾病,然而任何单一医院都难以积累足够多的某种病例以实现可靠诊断。跨医院协作可通过允许诊断机构利用分散的、病例特定的诊断证据来提供帮助,但隐私法规限制可识别的临床文本跨机构传输。这一场景带来两个挑战:现有医疗智能体系统通常依赖文本证据交换,而原始潜在状态(如隐藏状态和KV缓存)仍可能泄露源自提示词的临床内容。我们提出 MedLatentDx,一种潜在多智能体通信框架,其中医院智能体将私有临床记录和检索到的病例保留在本地,仅将紧凑的潜在KV块发送给主智能体以进行罕见病诊断。MedLatentDx 支持两种部署场景:同骨干网络医院智能体使用潜在KV蒸馏,而使用不同LLM骨干网络的医院则采用跨家族潜在对齐。在 CrossRare-Bench(一个自建的大规模罕见病基准测试,包含按医院划分的分区)上,MedLatentDx 提升了跨医院诊断性能,同时与原始潜在通信基线相比,减少了可重建的临床内容。
## 提交历史
来自:王梓青 [查看电子邮件(https://arxiv.org/show-email/f11fa665/2606.13945)]
**[v1]** 2026年6月11日星期四 22:11:25 UTC(1,501 KB)相似文章
见我所见,知我所想:异构智能体间的密集潜在通信
本文提出一种利用对齐的KV缓存变换在异构多智能体系统间进行密集潜在通信的方法,相比基于文本的方法,性能更优且计算成本更低。
MedExAgent:在嘈杂的临床环境中训练大语言模型代理进行询问、检查与诊断
本文介绍了 MedExAgent,这是一个将临床诊断形式化为部分可观测马尔可夫决策过程(POMDP)以处理嘈杂和不完整信息的框架。该框架提出了一种结合监督微调与强化学习的两阶段训练流程,以提高医疗大语言模型的诊断准确性和成本效益。
一种专门用于加速罕见病诊断的推理型大型语言模型:一项随机AI医生辅助试验
本文介绍了RaDaR,一个320亿参数的开源推理型大语言模型,基于公开和合成的罕见病病例进行训练。在诊断基准测试中,其表现优于DeepSeek-R1等更大模型,并在随机试验中将医生诊断准确率提升了21.44个百分点。
MedAction:迈向主动式多轮临床诊断大语言模型
本文介绍了 MedAction 框架,该框架通过模拟迭代式的检查开具与假设更新,训练大语言模型(LLM)进行主动的多轮临床诊断。文章提出了一个新的数据集 MedAction-32K,并展示了开源模型在医学基准测试上的最先进水平(SOTA)性能。
LingxiDiagBench:一个用于中文精神科咨询与诊断中LLM评估的多智能体基准框架
介绍了LingxiDiagBench,这是一个大规模多智能体基准,用于评估LLM在中文精神科咨询与诊断中的表现。关键发现表明:二分类任务上准确率高(最高达92.3%),但多分类鉴别诊断性能较差(抑郁-焦虑共病识别43.0%,12类鉴别诊断28.5%),揭示了对话质量与诊断准确性之间的脱节。