在资源受限环境下利用常规数据重建和预测阿尔茨海默病患者疾病轨迹

arXiv cs.AI 论文

摘要

本文介绍了GNOVA,一种GRU-神经常微分方程变分自编码器框架,用于从常规临床数据中重建和预测阿尔茨海默病的认知轨迹,无需昂贵的神经影像或生物标志物,在ADNI数据集上实现了低误差和不确定性估计。

arXiv:2606.07798v1 公告类型:新 摘要:阿尔茨海默病是一种进行性神经退行性疾病,其进展在不同患者间差异显著。现有研究旨在预测患者未来的认知状态,但极少关注从过去访视中重建状态。此外,在当前研究中,量化预测不确定性仍未被充分探索,且依赖于MRI、PET和CSF等昂贵模态,限制了在资源有限环境中的应用。在本研究中,我们的主要目标是:首先,从不规则访视中双向预测认知评分以呈现完整的疾病轨迹。其次,实现插值和外推能力以辅助临床医生进行知情的预后决策。第三,为所有预测提供校准良好的不确定性估计。最后,利用常规访视中可用的模态实现上述目标。我们提出了一个统一框架GNOVA:一种GRU-神经常微分方程变分自编码器。该架构在变分自编码器框架内结合了门控循环单元编码器和神经常微分方程解码器。在我们的工作中,我们预测了CDR-SB和MMSE评分。GRU编码器允许在任何时间点输入任意数量的数据。神经常微分方程解码器执行连续估计,允许在任何所需时间点进行插值和外推。变分自编码器允许对预测进行不确定性估计。我们使用了来自ADNI数据集的1,727名患者,时间跨度超过10年;该模型在无需任何神经影像或生物标志物数据的情况下,CDR-SB和MMSE评分的平均绝对误差分别达到1.35和2.28。特征消融研究表明,年龄、BMI和APOE4状态是强预测因子。所提出的框架能够重建不完整的患者病史并预测未来的认知状态。
查看原文
查看缓存全文

缓存时间: 2026/06/09 08:52

# 利用常规数据重建和预测阿尔茨海默病患者疾病轨迹:面向资源受限环境  
来源:https://arxiv.org/html/2606.07798  
Atri Chatterjeechatterjee\.atri@outlook\.com (https://arxiv.org/html/2606.07798v1/mailto:[email protected])  
Sitikantha Roysroy@am\.iitd\.ac\.in (https://arxiv.org/html/2606.07798v1/mailto:[email protected])  
Yardi School of Artificial Intelligence \(ScAI\), Indian Institute of Technology Delhi, Hauz Khas, Delhi, 110016, India  
Department of Neurology, Vardhman Mahavir Medical College and Safdarjung Hospital, Delhi, 110029, India  
Department of Applied Mechanics, Indian Institute of Technology Delhi, Hauz Khas, Delhi, 110016, India  

###### 摘要  
背景与目的:阿尔茨海默病是一种进行性神经退行性疾病,其进展在不同患者间差异显著。患者常不规律就诊,使得临床医生难以全面掌握患者疾病轨迹。现有研究主要致力于预测患者未来的认知状态,而很少关注从既往就诊中重建状态。此外,预测不确定性的量化仍相对未被充分探索,且大多数现有方法依赖MRI、PET和脑脊液生物标志物等高成本检查手段,限制了其在资源受限环境中的实际部署。在本研究中,我们的主要目标是:第一,从不规则就诊记录中双向预测认知评分,呈现完整的疾病轨迹;第二,实现插值与外推能力,辅助临床医生做出知情预后决策;第三,为所有预测提供良好校准的不确定性估计;最后,利用常规就诊中可用的检查手段实现上述目标。  
方法:我们提出一个统一框架GNOVA:一种GRU-神经常微分方程变分自编码器。该架构在变分自编码器框架内,结合了门控循环单元编码器和神经常微分方程解码器。在本工作中,我们预测CDR-SB和MMSE评分。GRU编码器允许在任意时间点输入任意数量的数据。神经常微分方程解码器进行连续估计,允许在任意期望时间点进行插值和外推。变分自编码器允许对预测进行不确定性估计。  
结果:我们使用阿尔茨海默病神经影像学倡议(ADNI)数据集中的1,727名患者,时间跨度10年;模型在不需要任何神经影像或生物标志物数据的情况下,CDR-SB和MMSE评分的平均绝对误差分别为1.35和2.28。模型在预测置信区间内捕获了平均85%的真实CDR-SB值,但在较长外推时间范围内覆盖率有所下降。特征消融研究显示,年龄、BMI和APOE4状态是强预测因子。  
结论:所提出的框架能够重建不完整的患者病史并预测未来认知状态,从而支持个体化预后决策。此类工作有助于推动可在资源受限环境中部署的模型和框架的开发。  

###### 关键词:阿尔茨海默病进展、疾病轨迹建模、神经常微分方程、变分自编码器、不确定性量化、资源受限环境  

## 1 引言  

阿尔茨海默病(AD)是一种进行性神经退行性疾病,会随时间损害脑细胞,导致认知能力不可逆地下降(Evans et al. [2019](https://arxiv.org/html/2606.07798#bib.bib33))。据世界卫生组织统计,2021年全球约有5700万人患有痴呆症,每年新增1000万例。全球范围内,AD是第七大死因,每年造成约1.3万亿美元损失,约占所有痴呆症病例的70%(World Health Organization [2024](https://arxiv.org/html/2606.07798#bib.bib32))。目前该病无法治愈,只能通过及时临床干预延缓进展。最初,AD只能在尸检时检测出来。然而,技术的进步使临床医生能够依赖神经影像、体液检查和认知评估等方式来诊断和监测AD(Blennow [2017](https://arxiv.org/html/2606.07798#bib.bib31))。AD的特征是大脑中异常的β-淀粉样蛋白(Aβ42)斑块积聚和tau蛋白缠结(Zhang et al. [2024](https://arxiv.org/html/2606.07798#bib.bib39))。正电子发射断层扫描(PET)成像和脑脊液(CSF)淀粉样蛋白-β42(Aβ42)水平可以高灵敏度地检测这些标志物(Schaap et al. [2024](https://arxiv.org/html/2606.07798#bib.bib30), Lowe et al. [2024](https://arxiv.org/html/2606.07798#bib.bib29))。然而,这些检查成本高、具有侵入性且需要熟练人员,使得在大多数临床环境中进行常规纵向随访不切实际。因此,临床医生通常主要依赖认知评估工具来跟踪疾病进展。最近一项研究中,Schaap等人发现认知评分与淀粉样蛋白阳性之间存在强相关性。结果显示,MMSE评分在患者转为淀粉样蛋白阳性后约0.2年开始下降,而CDR-SB评分在发病后约1.4年开始恶化(Schaap et al. [2024](https://arxiv.org/html/2606.07798#bib.bib30))。这凸显了追踪认知评分以跟踪疾病进展的临床价值。在本研究中,我们旨在预测两种广泛使用的认知评估的轨迹:临床痴呆评分总和量表(CDR-SB,范围0-18),它整合了认知和功能领域(Tzeng et al. [2022](https://arxiv.org/html/2606.07798#bib.bib28));以及简易精神状态检查(MMSE,范围0-30),它评估定向力、注意力、记忆力、语言和视空间技能(Folstein et al. [1975](https://arxiv.org/html/2606.07798#bib.bib27))。  
AD进展在不同患者间差异很大。在轻度认知障碍(MCI)患者中,Mouchet等人发现约21%的患者在四年内进展迅速,22%进展缓慢,57%无进展(Mouchet et al. [2021](https://arxiv.org/html/2606.07798#bib.bib26))。该研究强调了疾病进展的不确定性以及持续追踪评分以了解其本质的重要性。然而,在实际场景中,由于患者就诊不规律或仅在病情恶化时就诊,临床医生通常缺乏对疾病的充分历史背景了解。这使得临床医生难以区分不同进展速度的患者,从而延误治疗决策。正是这种情况促使了对双向轨迹建模的需求:一个模型不仅能预测未来认知状态,还能从稀疏、不规则间隔的观测中回顾性地重建过去状态。  
在过去十年中,人工智能的进步促使研究人员开发计算工具来建模AD进展。早期的努力依赖于传统机器学习算法——支持向量回归(Lei et al. [2020](https://arxiv.org/html/2606.07798#bib.bib18))、基于树的方法(Jiang et al. [2021](https://arxiv.org/html/2606.07798#bib.bib22))、梯度提升方法(Devanarayan et al. [2024](https://arxiv.org/html/2606.07798#bib.bib11), Tabarestani et al. [2020](https://arxiv.org/html/2606.07798#bib.bib24))以及高斯过程(GP)(Peterson et al. [2018](https://arxiv.org/html/2606.07798#bib.bib19), Puri et al. [2022](https://arxiv.org/html/2606.07798#bib.bib21))。深度学习的引入使研究人员能够纳入神经影像模态并捕捉非线性关系以预测认知评分(Liu et al. [2020](https://arxiv.org/html/2606.07798#bib.bib6), Morar et al. [2020](https://arxiv.org/html/2606.07798#bib.bib23), Yuan et al. [2024](https://arxiv.org/html/2606.07798#bib.bib14))。然而,这些方法通常预测三到五年的短时间范围,并未捕捉纵向数据中固有的时间依赖性。虽然GP可以建模10年轨迹,但其扩展性差,现有研究仅局限于约100名患者(Peterson et al. [2018](https://arxiv.org/html/2606.07798#bib.bib19), Puri et al. [2022](https://arxiv.org/html/2606.07798#bib.bib21))。  
循环神经网络(RNN)及其门控变体——长短期记忆(LSTM)和门控循环单元(GRU)(Goodfellow et al. [2016](https://arxiv.org/html/2606.07798#bib.bib36), Cho et al. [2014](https://arxiv.org/html/2606.07798#bib.bib34))自然地解决了序列数据的时间建模问题。研究人员采用RNN变体来提高预测性能和插补能力:MinimalRNN(Nguyen et al. [2020](https://arxiv.org/html/2606.07798#bib.bib10))和DeepRNN(Jung et al. [2021](https://arxiv.org/html/2606.07798#bib.bib16))用于个体化预测,Time\_LSTM(Liang et al. [2021](https://arxiv.org/html/2606.07798#bib.bib5))用于多任务学习。Mukherji等人和Morar等人使用多对一架构进行长期预测和有效捕捉时间依赖性(Mukherji et al. [2022](https://arxiv.org/html/2606.07798#bib.bib9), Morar et al. [2023](https://arxiv.org/html/2606.07798#bib.bib7)),而编码器-解码器架构(Cho et al. [2014](https://arxiv.org/html/2606.07798#bib.bib34))后来被用于处理分类任务中的可变序列长度(Poonam et al. [2023](https://arxiv.org/html/2606.07798#bib.bib25), [2024](https://arxiv.org/html/2606.07798#bib.bib12))。Das等人在实验中发现,在预测ADAS-13和CDR-SB评分方面,GRU的表现略优于RNN和LSTM(Das et al. [2025](https://arxiv.org/html/2606.07798#bib.bib41))。此外,GRU性能相当且比LSTM更快(Goodfellow et al. [2016](https://arxiv.org/html/2606.07798#bib.bib36), Chung et al. [2014](https://arxiv.org/html/2606.07798#bib.bib42))。统计方法如线性混合效应模型自然地适应重复测量和不规则就诊时间表,但局限于点估计,假设线性关系,且无法构建双向轨迹或在任意未观测时间点进行插值预测。  
最近,一种有前景的处理不规则采样时间序列数据的方法通过神经常微分方程(Neural ODEs)出现。与传统以固定间隔处理数据的离散模型不同,神经常微分方程连续地建模系统动态(Chen et al. [2019](https://arxiv.org/html/2606.07798#bib.bib4)),使得认知评分进展可以表示为一条平滑轨迹,并可在任意期望时间点进行评估。这对于AD尤其有价值,因为其进展本质上是连续的,但临床观察发生在可变且通常间隔很长的时点上。Jeong等人通过使用GRU-ODE架构来建模认知评分轨迹,展示了这一潜力(Jeong et al. [2024](https://arxiv.org/html/2606.07798#bib.bib3))。虽然他们的方法有效地捕捉了连续动态,但仍是确定性的,没有量化预测不确定性。基于GRU的模型能很好地捕捉时间依赖性,但仅在离散的观测时间点操作。基于神经常微分方程的模型能实现连续动态,但缺乏有原则的不确定性估计。单独的变分自编码器提供概率输出,但不建模连续时间演化。据我们所知,目前没有现有方法仅依赖常规临床数据,并将所有三种能力结合在一个统一框架中来预测AD疾病轨迹。  
在本工作中,我们引入GNOVA,通过结合GRU的序列时间编码能力、神经常微分方程的连续潜在轨迹建模能力、变分自编码器的有原则不确定性估计能力,以及一个专门的静态协变量编码器,来填补这些空白。所得模型使临床医生能够重建不完整的患者病史、在任意期望时间点预测未来认知状态,并为所有预测提供校准的置信区间——仅使用常规就诊期间收集的标准人口统计学和临床数据,无需神经影像或生物标志物检测。这使得该框架可在缺乏先进诊断基础设施的资源受限环境中部署。  

## 2 方法与材料  

### 2.1 数据  

#### 2.1.1 数据集与参与者  
在本工作中,我们使用了阿尔茨海默病神经影像学倡议(ADNI)数据集(Mueller et al. [2005](https://arxiv.org/html/2606.07798#bib.bib2))。该数据集可通过 https://adni.loni.usc.edu/ 获取。ADNI包含多种模态,包括MRI和PET扫描、人口统计学和常规临床信息以及认知评估评分。在本研究中,我们纳入了具有基线评估(记为‘bl’)、一年随访(‘m12’)以及基线后10年内(‘m120’)至少一次额外随访的参与者。共有1727名患者符合这些标准。其中男性977人(56.57%),女性750人(43.43%)。为构建模型,我们选择了以下特征:人口统计数据(年龄、性别[男/女]、受教育年限、BMI)、高血压状况(是/否)、诊断状况(认知正常[CN]、轻度认知障碍[MCI]、痴呆[AD])、APOE4基因状况(非携带者、杂合子、纯合子)以及认知评分(CDR-SB和MMSE)。我们选择了在标准临床就诊中常规收集的特征,无需神经影像或生物标志物基础设施。表1(https://arxiv.org/html/2606.07798#A1.T1)提供了所有输入特征的完整描述,包括其类型、编码和结果维度。  

#### 2.1.2 数据预处理  
数据集中的分类特征采用独热编码,连续变量按最大值进行缩放。为处理缺失值,我们使用前向填充法进行插补。有多种处理缺失值的技术。然而,正如Das等人(Das et al. [2025](https://arxiv.org/html/2606.07798#bib.bib41))的研究所述,前向填充法在预测准确性方面与其他方法相当,且易于实现和理解。除目标特征(CDR-SB和MMSE评分)和年龄(可通过加减访视差进行插补)外,所有特征均进行了插补。我们没有插补目标变量(CDR-SB和MMSE),因为插补预测目标会在评估时产生不正确的模型性能估计。基线后的访视代码转换为分数年。例如,基线(’bl’)编码为0.0,’m06’为0.5,’m12’为1.0,以此类推,最大访视代码’m120’编码为10.0。年度和年中访视的患者数量及描述性统计分别见表1(https://arxiv.org/html/2606.07798#S2.T1)和表2(https://arxiv.org/html/2606.07798#S2.T2)。  

特征时间点:0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10  
计数:1727, 1727, 1332, 851, 690, 371, 329, 250, 195, 133, 113  

连续变量(均值±标准差):  
BMI:26.77±5.35, 26.71±5.36, 26.44±5.58, 26.27±6.06, 26.1±7.29, 26.28±6.31, 25.86±6.23, 25.67±6.74, 26.12±6.1, 25.43±6.73, 25.91±6.8  
教育年限:16.0±2.76, 16.

相似文章