利用深度学习进行具有不确定性意识的阿尔茨海默病进展纵向预测

arXiv cs.AI 论文

摘要

本文提出了一种概率框架,用于阿尔茨海默病进展预测,该框架结合了有序诊断预测、多时间点轨迹生成和分解不确定性估计,采用 Temporal Fusion Transformer 编码器和自回归混合密度网络。在ADNI数据上,该模型优于基线,实现了接近标称的90%可信区间覆盖率,并提供了具有临床意义的不确定性信号。

arXiv:2606.24604v1 公告类型:新 摘要:阿尔茨海默病进展的纵向建模只有在不仅能描述最可能的下一步诊断,还能描述患者随时间如何演变以及该预测的可靠性时,才具有临床实用性。大多数深度学习方法将这一问题简化为单步分类,将认知正常、轻度认知障碍和痴呆视为平坦类别,而对不确定性如何在未来就诊中累积提供的见解有限。我们提出了一种概率框架,结合了有序诊断预测、多时间点轨迹生成和分解不确定性估计。对 Temporal Fusion Transformer 编码器进行了改进,加入了 CORAL 有序输出层、非对称损失加权和转换器过采样,以尊重疾病阶段顺序并提高对 MCI 向痴呆转变的敏感性。基于学习到的患者上下文表示,自回归混合密度网络生成诊断状态、CDR 总盒数、MMSE 定向力和海马体积的五年概率轨迹。在 ADNI 上,该模型在下一次就诊诊断预测方面优于线性、循环和 Transformer 基线,在 MCI 与痴呆的区分上提升最为显著。生成的轨迹实现了接近标称的 90% 可信区间覆盖率,在预测时间范围内不确定性扩大,且生物标志物动态与预期的阿尔茨海默病进展一致。我们进一步利用解析混合方差和五成员自助集成分离偶然不确定性和认知不确定性,这提供了最强的编码器多样性和输出层认知信号。对于罕见进展原型(MCI 和痴呆患者)以及在 OASIS-3 上的外部评估中,认知不确定性更高,且随着预测误差的增加而增加。
查看原文
查看缓存全文

缓存时间: 2026/06/24 07:48

# 使用深度学习进行阿尔茨海默病进展的不确定性感知纵向预测  
来源:https://arxiv.org/html/2606.24604  
\credit 概念化、方法论、软件、形式分析、原始草稿写作 1\]组织=计算机科学与工程系,R.V.工程学院,城市=班加罗尔,邦=卡纳塔克邦,国家=印度  
\credit 监督、写作 – 审阅与编辑 2\]组织=计算机科学学院,诺丁汉大学,城市=诺丁汉,国家=英国  
\cormark [1]  
\cortext [1]通讯作者 Shreyank N. Gowda [email protected]  
Anala M. Ranala [email protected]  

###### 摘要  
阿尔茨海默病进展的纵向建模在临床上有用,仅当它不仅能描述最可能的下一诊断,还能描述患者如何随时间演变以及该预测的可靠性时。大多数深度学习方法将此问题简化为单步分类,将认知正常、轻度认知障碍和痴呆视为扁平类别,同时对于不确定性如何在未来就诊中累积提供的见解有限。我们提出了一个概率框架,结合了序数诊断预测、多时间跨度轨迹生成和分解的不确定性估计。对时间融合变换器编码器进行调整,加入CORAL序数输出层、非对称损失加权和转换器过采样,以尊重疾病阶段的顺序并提高对MCI到痴呆转换的敏感性。基于学习到的患者上下文表示,一个自回归混合密度网络生成五年概率轨迹,用于诊断状态、CDR方框总和、MMSE定向和 hippocampal 体积。在ADNI上,该模型在下次就诊诊断预测方面优于线性、循环和变换器基线,在MCI与痴呆区分上取得最强增益。生成的轨迹实现了接近名义的90%可信区间覆盖,不确定性在预测范围内扩大,生物标志物动态与预期的阿尔茨海默病进展一致。我们进一步使用分析混合方差和五成员自举集成将偶然不确定性与认知不确定性分离,这提供了最强的编码器多样性和输出级认知信号。认知不确定性在罕见进展原型、MCI和痴呆患者中更高,并且在OASIS-3上的外部评估中随预测误差增加而增加。这些结果表明,概率纵向预测可以提供患者特定的疾病轨迹,以及何时应谨慎对待预测的临床有意义信号。  
代码:[https://github.com/Arya-Hari/ldpm-ad](https://github.com/Arya-Hari/ldpm-ad)  

###### 关键词:阿尔茨海默病进展、时间融合变换器、混合密度网络、序数回归、不确定性分解、分布外泛化、纵向临床建模  

## 1 引言  
阿尔茨海默病(AD)是全球痴呆的主要原因,估计影响3500万人,预计到2050年将超过1.39亿[42](https://arxiv.org/html/2606.24604#bib.bib42)。其临床病程本质上是纵向的。进行性神经退行性变可能在症状变得临床明显之前数年甚至数十年就开始[17](https://arxiv.org/html/2606.24604#bib.bib17),患者可能保持稳定、缓慢下降或快速转换,取决于生物学、认知和临床因素的复杂组合。这种时间性质使得疾病进展建模在临床上很重要。如果能从纵向临床和神经影像数据中可靠地表征未来轨迹,它们就可以支持试验招募、治疗时机和个性化护理计划[33](https://arxiv.org/html/2606.24604#bib.bib33)。然而,AD进展建模的核心问题不仅仅是患者下次就诊时会得到什么诊断。一个临床有用的模型应回答更丰富的问题。患者在未来几年内可能如何演变?可能的未来范围有多大?模型的不确定性是由于疾病进程本身的可变性,还是因为患者在训练数据中代表性不足?这些问题对于轻度认知障碍(MCI)患者尤其重要,因为其向痴呆的进展是异质性的,即使从丰富的纵向数据中也难以预测[31](https://arxiv.org/html/2606.24604#bib.bib31)。  
现有计算方法仅部分解决了这个问题。经典统计模型,包括纵向和时间至事件结果的联合模型[34](https://arxiv.org/html/2606.24604#bib.bib34)、基于事件的模型[10](https://arxiv.org/html/2606.24604#bib.bib10)和微分方程公式[30](https://arxiv.org/html/2606.24604#bib.bib30),提供了有用的可解释性,但通常依赖于可能无法捕捉个体轨迹异质性的参数假设。深度学习方法在结构化临床时间序列上表现出强大的判别性能[29](https://arxiv.org/html/2606.24604#bib.bib29),[11](https://arxiv.org/html/2606.24604#bib.bib11),但许多仍被公式化为下次就诊分类模型,根据观察到的历史预测单个未来诊断标签。这种公式化在两个方面限制了临床实用性。首先,它将认知正常(CN)、MCI和痴呆视为扁平类别,尽管AD进展遵循临床有意义的序数结构。CN到MCI的错误不等同于CN到痴呆的错误,但标准交叉熵训练没有编码这种区别。其次,点预测对未来的疾病轨迹不确定性,或当模型应用于不同队列时其置信度是否仍然可靠,提供的见解有限。  
不确定性量化因此已成为临床机器学习中的核心关注点[25](https://arxiv.org/html/2606.24604#bib.bib25),[4](https://arxiv.org/html/2606.24604#bib.bib4)。在高风险的预后环境中,一个错误但自信的模型可能比错误但不确定的模型更有害。对于AD,这一担忧尤为严重,因为临床上最重要的病例往往是最不确定的:MCI患者可能多年保持稳定或快速进展为痴呆,两种结果都可能从相同的观察历史中合理。尽管如此,大多数关于AD进展的深度学习研究报告判别指标如准确率或AUROC,而不评估不确定性如何在多步预测中传播,或者不确定性在外部队列转移下是否有意义。  
另一个挑战是,并非所有不确定性具有相同的临床含义。偶然不确定性反映了个体疾病进程固有的不可预测性,而认知不确定性反映了模型的无知,可以通过更多或更具代表性的数据来减少[16](https://arxiv.org/html/2606.24604#bib.bib16),[21](https://arxiv.org/html/2606.24604#bib.bib21)。混淆这两个来源会模糊重要的部署信号。偶然不确定性高的患者可能需要更密切的监测,因为多种疾病轨迹仍然真实可能。认知不确定性高的患者则可能表明模型遇到了代表性不足的表型、缺失的特征模式或队列转移。这种区别对于在阿尔茨海默病神经影像倡议(ADNI)[40](https://arxiv.org/html/2606.24604#bib.bib40)等数据集上训练的模型尤为重要,这些数据集非常有价值,但可能不能完全代表外部临床队列中遇到的患者多样性。  
受这些差距的驱动,我们提出了四个研究问题。首先,AD进展能否被建模为序数纵向过程而非扁平分类问题?其次,模型能否生成多年概率轨迹而不仅仅是单个下次就诊诊断?第三,预测不确定性能否被分解为具有不同临床含义的偶然和认知成分?第四,当模型在训练期间未见的外部队列上评估时,认知不确定性能否提供有用信号?为了解决这些问题,我们提出了一个统一的框架用于概率纵向AD进展建模。该框架在单个预测管道中结合了序数诊断预测、自回归轨迹生成和不确定性分解。我们的主要贡献如下:  
1.  **序数时间融合变换器**。我们将时间融合变换器(TFT)[28](https://arxiv.org/html/2606.24604#bib.bib28)(一种设计用于多时间跨度预测并具有可解释注意力的架构)适应于纵向AD进展建模。TFT与CORAL序数输出层[6](https://arxiv.org/html/2606.24604#bib.bib6)、非对称损失加权和转换器过采样相结合,以尊重CN、MCI和痴呆的有序结构,同时优先考虑临床重要的MCI到痴呆转换事件。  
2.  **概率轨迹生成**。基于TFT编码器的患者级上下文表示,一个自回归混合密度网络(MDN)[5](https://arxiv.org/html/2606.24604#bib.bib5)生成五年概率轨迹,涵盖诊断状态、临床痴呆评定量表(CDR)方框总和、简易精神状态检查(MMSE)定向和海马体积。这使得模型能够表示多种可能的未来,而非单一的确定性路径。  
3.  **分解的不确定性估计**。我们利用总方差定律将预测不确定性分解为偶然和认知成分。偶然不确定性通过MDN混合方差分析估计,而认知不确定性通过五成员深度集成[26](https://arxiv.org/html/2606.24604#bib.bib26)估计。这使得模型能够区分来自疾病固有变异性的不确定性和来自有限模型知识的不确定性。  
4.  **外部分布外验证**。我们在OASIS-3[27](https://arxiv.org/html/2606.24604#bib.bib27)上评估模型,这是一个训练期间未见的不同外部队列。我们描述了ADNI和OASIS-3之间的协变量偏移,量化了零样本迁移差距,并检验了当预测在分布偏移下变得不太可靠时认知不确定性是否增加。  
ADNI上的实验表明,所提出的序数TFT在下次就诊诊断预测方面优于线性、循环和变换器基线,在MCI与痴呆区分上取得最强增益。轨迹生成器产生五年预测,具有接近名义的90%可信区间覆盖,不确定性在预测范围内扩大,生物标志物动态与已建立的AD进展模式一致[17](https://arxiv.org/html/2606.24604#bib.bib17)。不确定性分析显示,认知不确定性在罕见进展原型、MCI和痴呆患者以及预测误差增加的外部OASIS-3病例中更高。这些发现共同表明,概率纵向预测可以提供患者特定的疾病轨迹以及何时应对模型预测持谨慎态度的临床有意义信号。  
本文其余部分组织如下。第2节回顾了疾病进展建模、临床数据序列建模、序数学习和不确定性量化的相关工作。第3节描述了ADNI和OASIS-3数据集及预处理流程。第4节详细介绍了模型架构、训练过程和不确定性分解框架。第5节呈现实验结果和消融研究。第6节讨论临床意义、局限性和未来工作方向。  

## 2 相关工作  
计算建模阿尔茨海默病进展的方法在过去十年中有了实质性演变,从可解释的统计模型发展到用于纵向临床数据的深度序列模型。然而,四个方法论差距对当前工作仍然核心:大多数模型要么对疾病轨迹施加限制性假设,要么关注单步确定性预测,要么忽略诊断转换的序数结构,要么报告不确定性而不分离其临床不同的来源。  
AD进展的早期工作建立了有影响力的生物标志物排序框架,如基于事件的模型[10](https://arxiv.org/html/2606.24604#bib.bib10)和微分方程公式[30](https://arxiv.org/html/2606.24604#bib.bib30)。这些方法仍然有价值,因为它们提供了疾病进化的可解释描述。然而,它们通常依赖于强参数假设,可能无法完全容纳在大型纵向队列如ADNI中观察到的异质性。  
深度学习方法在结构化临床时间序列上提高了判别性能[29](https://arxiv.org/html/2606.24604#bib.bib29),[11](https://arxiv.org/html/2606.24604#bib.bib11)。循环架构已被用于下次就诊诊断预测,而基于变换器的模型已被探索用于基于影像的分类和纵向序列建模[9](https://arxiv.org/html/2606.24604#bib.bib9),[36](https://arxiv.org/html/2606.24604#bib.bib36)。尽管有这些进展,大部分工作仍然集中在预测紧接着的下一个诊断状态。这种下次就诊分类焦点在临床上是有限的,因为它丢弃了可能对护理规划和试验招募相关的长期轨迹信息。Wang等人[39](https://arxiv.org/html/2606.24604#bib.bib39)提出了一种用于长期AD进展的多模态深度学习模型,结合了临床和影像特征之间的交互,展示了比单模态基线更好的多步预测。Hashemifar等人[13](https://arxiv.org/html/2606.24604#bib.bib13)通过跨多个数据集训练来解决单队列限制。He等人[14](https://arxiv.org/html/2606.24604#bib.bib14)提出了一个阶段感知的专家混合框架,用于使用图神经扩散进行神经退行性进展建模,实现了可解释的阶段特定机制。然而,这些工作仍然主要是确定性的或关注空间传播模式而非概率临床轨迹生成。它们没有联合建模多年未来轨迹并带有校准和分解的不确定性估计,这是本工作解决的主要差距。  
纵向临床队列也提出了与电子健康记录数据共享的挑战:就诊间隔不规则,观察值可能缺失,患者群体在不同站点和协议间存在异质性。标准循环架构如GRU和LSTM可以处理序列历史,但它们通常依赖于插值和掩码,并且可能均匀对待时间间隔。时间融合变换器(TFT)[28](https://arxiv.org/html/2606.24604#bib.bib28)

相似文章

BatteryMFormer:多层级学习用于电池退化轨迹预测

arXiv cs.AI

本文提出了BatteryMFormer,一种用于早期电池退化轨迹预测的多层级Transformer,它集成了老化条件感知解码、元退化模式记忆和双视角编码,以捕捉多层级退化结构和SOC局部变化,在四个电池领域上持续优于最先进的基线方法。