基于混合潜空间建模的结构连接组获取变异无监督学习

arXiv cs.LG 论文

摘要

本文提出了一种无监督框架,通过混合潜空间建模来模拟结构连接组中与获取相关的变异,利用架构退火编码器输出消除了手动容量调优的需求。

arXiv:2605.13933v1 Announce Type: new 摘要:不同站点、扫描仪和协议之间的扩散MRI获取差异引入了变异,使得结构连接组分析复杂化。这促使深度学习模型能够在低维空间中表示高维连接组,同时明确地将获取相关效应与生物变异分离开来。传统的降维方法将所有方差建模为连续的,因此获取效应往往被吸收到连续潜空间中。最近的混合潜空间模型结合了离散和连续组件以解决这一问题,但通常需要手动容量调优以确保离散组件捕获预期的变异。我们提出了一种无监督框架,通过在解码前对编码器输出进行架构退火,消除了手动调优,使模型能够在训练过程中自适应地平衡离散和连续潜变量。为了评估该框架,我们整理了一个数据集,包含N=7,416个来自扩散MRI的结构连接组,年龄范围2至102岁,涵盖13项研究中的25种独特获取参数组合。其中,5,900例认知正常,877例轻度认知障碍(MCI),639例阿尔茨海默病(AD)。我们与标准VAE、PCA结合k-means聚类以及仅通过损失函数进行退火的混合模型进行了比较。我们的架构退火在站点学习上产生了更强的结果(ARI=0.53,p<0.05),优于这些基线。结果表明,结合连续和离散潜变量、采用架构退火而非基于损失退火的混合模型,为捕获扩散MRI中的获取变异提供了一种有用的无监督机制:通过联合建模平滑和类别结构,Joint-VAE恢复了与扫描仪和协议差异对齐的聚类。
查看原文
查看缓存全文

缓存时间: 2026/05/15 06:25

# 通过混合潜空间建模无监督学习结构连接组中的采集变异性
来源: https://arxiv.org/html/2605.13933
\\jmlrvolume

– 审核中\\jmlryear2026\\jmlrworkshop全文 – MIDL 2026投稿\\midlauthor\\NameGaurav Rudravaram\\nametag1\\Emailgaurav\.rudravaram@vanderbilt\.edu \\addr1范德比尔特大学电气与计算机工程系,田纳西州纳什维尔,美国 \\NameLianrui Zuo\\nametag1\\Emaillianrui\.zuo@vanderbilt\.edu \\NameMichael E\. Kim\\nametag2\\Emailmichael\.kim@vanderbilt\.edu \\addr2范德比尔特大学计算机科学系,田纳西州纳什维尔,美国 \\NameKarthik Ramadass\\nametag1,2\\Emailkarthik\.ramadass@vanderbilt\.edu \\NameElyssa McMaster\\nametag1\\Emailelyssa\.mcmaster@vanderbilt\.edu \\NameJongyeon Yoon\\nametag2\\Emailjongyeon\.yoon@vanderbilt\.ed \\NameAravind R\. Krishnan\\nametag1\\Emailaravind\.r\.krishnan@vanderbilt\.edu \\NameAdam M\. Saunders\\nametag1\\Emailadam\.m\.saunders@vanderbilt\.edu \\NameChenyu Gao\\nametag1\\Emailchenyu\.gao@vanderbilt\.edu \\NameNancy R\. Newlin\\nametag3\\Emailnewlinn@mskcc\.org \\addr3纪念斯隆凯特琳癌症中心,纽约州纽约市,美国 \\NamePraitayini Kanakaraj\\nametag2\\Emailpraitayini\.kanakaraj@vanderbilt\.ed \\NameLori L\. Beason Held\\nametag4\\Emailheldlo@grc\.nia\.nih\.gov \\addr4美国国立卫生研究院国家老龄化研究所行为神经科学实验室,马里兰州巴尔的摩,美国 \\NameMurat Bilgel\\nametag4\\Emailmurat\.bilgel@nih\.gov \\NameLaura A\. Barquero\\nametag5\\Emaillaura\.barquero@Vanderbilt\.Edu \\addr5范德比尔特大学皮博迪教育与人类发展学院,田纳西州纳什维尔,美国 \\NameMicah D’Archangel\\nametag5\\Emailmicah\.a\.darchangel@vanderbilt\.edu \\NameTin Q\. Nguyen\\nametag5\\Emailtin\.nguyen@vanderbilt\.edu \\NameLaurie B\. Cutting\\nametag5\\Emaillaurie\.cutting@Vanderbilt\.Edu \\NameDerek Archer\\nametag6\\Emailderek\.archer@vumc\.org \\addr6范德比尔特大学医学中心,范德比尔特记忆与阿尔茨海默中心,田纳西州纳什维尔,美国 \\NameTimothy J\. Hohman\\nametag6\\Emailtimothy\.j\.hohman@vumc\.org \\NameDaniel C\. Moyer\\nametag2\\Emaildaniel\.moyer@Vanderbilt\.Edu \\NameBennett A\. Landman\\nametag1,2\\Emailbennett\.landman@vanderbilt\.edu

###### 摘要

dMRI中不同站点、扫描仪和协议的采集差异会在结构连接组分析中引入变异性。这促使我们需要深度学习模型,这些模型能够在低维空间中表示下游高维结构连接组,同时明确地将采集相关效应与潜在生物变异分离开来。传统的统计和深度学习降维方法通常将所有变异源建模为连续的,从而难以将离散效应(例如,与采集或站点相关的效应)与连续生物变异分开。因此,采集相关效应往往会被吸收到连续潜空间中。深度学习的最新进展探索了混合潜空间建模,其中离散和连续组件共同表示结构化变异。然而,现有的混合方法通常依赖于手动容量调整,以确保离散组件捕获所需的变异性(例如,采集)。在这里,我们引入了一个原则性的无监督框架,通过在解码前对编码器输出进行架构退火来消除这种手动容量调整的需求,允许模型在训练过程中自适应地平衡离散和连续潜变量的贡献。为了研究这种联合潜空间建模,我们整理了一个大型数据集(N=7,416;60%为女性),该数据集包含了参与者dMRI扫描所得的结构连接组。我们的数据集年龄范围为2至102岁,涵盖了13项不同的研究,具有25种独特的采集参数组合。其中,5,900人为认知未受损/神经典型,877人被诊断为轻度认知障碍(MCI),639人被诊断为阿尔茨海默病(AD)。我们将我们的方法与标准VAE、PCA后接k-means聚类以及仅通过损失函数进行退火的混合模型进行了比较,结果表明,架构退火在站点学习方面更强(ARI=0.53,p<0.05),优于其他方法。这些结果证明,所提出的混合连续-离散潜空间提供了一种有用的无监督机制,用于捕捉弥散MRI中的采集相关变异性;通过联合建模平滑和分类结构,Joint-VAE恢复了与扫描仪和协议差异相一致的有意义聚类。

###### 关键词:

无监督表示学习,结构连接组,协调

††编辑:Under Review for MIDL 2026## 1引言

白质连接性和微结构完整性对于理解神经退行性疾病[kamagata2021diffusion]、认知衰退[vogt2020cortical]和衰老[kantarci2014white]至关重要。弥散MRI(dMRI)非常适合这些研究,因为水分子扩散受到轴突膜和髓鞘的限制,提供了微结构组织的间接特征[jones2010diffusion]。通过建模弥散加权信号,dMRI可以估计各向异性分数(FA)、平均弥散率(MD)等定量指标,以及更先进的基于隔室的测量,以反映轴突完整性和组织组成[mori2013introduction]。这些信号还可用于进行纤维束成像并构建结构连接组,以表征大规模网络组织,用于下游统计或机器学习分析[shamir2025tutorial]。

尽管其重要性,dMRI受采集异质性的严重影响,这使在跨研究或队列中得出可推广结论的能力复杂化。弥散衍生指标已被证明在不同回波时间(TE)、重复时间(TR)、磁场强度和弥散加权下变化显著[hui2010b,yao2023both]。更高的b值会降低信噪比,hui2010band和yao2023both均表明,从不同b值获取的数据计算得出的FA、MD及相关数量存在显著差异,反映了噪声基底效应和潜在组织隔室差异的组合。多壳层采集引入了额外的复杂性:虽然它们能够对交叉纤维和多隔室微结构进行更具表现力的建模——支持如NODDIzhang2012noddi;jelescu2017design等模型——但它们也产生了与单壳层数据衍生连接组存在显著差异的连接组,其中yao2023both表明,使用多壳层衍生连接组时,预测帕金森病的敏感性更高。尽管此类采集差异通常被有意利用以优化对特定微结构特性或脑区的敏感性caiazzo2016q,但当跨扫描仪或协议整合数据时,它们就变得有问题:即使微小的变化也会改变弥散信号,并传播到微结构估计、纤维束成像,最终影响连接组本身。因此,在不同采集协议下从同一受试者生成的连接组可能表现出显著差异prvckovska2016reproducibility;villalon2016reliability,使得在多点分析中难以将生物效应与采集驱动的变异性区分开来。

这种变异性推动了协调技术的发展,旨在减少组分析或机器学习任务前的采集相关差异。统计方法如ComBatfortin2017harmonization已被应用于从标量脑连接性指标中去除协议效应,而最近的深度学习方法则试图学习对采集域不变的潜在结构连接组表示。自编码器[zheng2025connectomeae]、图神经网络[noman2024graph]和条件变分自动编码器(CVAEs)[newlin2025harmonizing;zuo2021unsupervised;zuo2023haca3]都被用于通过依赖站点标签或采集相关变量来强制站点不变性。对抗性图神经网络框架进一步结合了站点分类器和站点条件解码器来抑制域信息[patel2025structural]。然而,这些方法都依赖于预定义的站点或扫描仪标签,这是一个显著局限,因为采集变异性可能存在于单个数据集内,或者元数据可能不完整或不准确[zuo2022disentangling]。这促使我们需要能够直接从数据本身中解开采集相关变异的无监督模型。

结合连续和离散表示的混合潜空间模型为这种无监督解缠提供了一条有希望的路径。遵循dupont2018learning的一个洞见,即离散潜变量可以捕获结构化的分类变异,我们将站点效应(由采集参数和协议差异组合产生)视为叠加在连续生物变异之上的离散组件。这种联合表示允许模型在没有站点标签的情况下推断站点结构[rudravaram2025characterizing]。然而,原始的混合公式依赖于一种启发式的铰链边际机制来平衡连续和离散潜空间之间的容量,仅提供对信息分配的间接控制。我们之前的工作[rudravaram2025characterizing]通过引入一种基于损失的容量调节策略来解决这个问题,该策略提高了稳定性与可解释性。在本文中,我们将该框架扩展到更大且更多样化的多站点数据集,并引入一种分阶段、基于模型的退火过程,在架构内部调整容量。这种新策略增加了离散空间的利用率,并能够以完全无监督的方式恢复更有意义的采集相关聚类。

## 2方法

### 2.1数据和预处理

为了评估用于结构连接组的混合连续-离散潜空间模型,我们整理了一个大型多队列dMRI数据集,涵盖了13项主要神经影像研究。对于具有纵向成像的数据集,我们为每位参与者选择了一次扫描,以避免重复测量的偏差。最终数据集包括来自BLSAferrucci2008baltimore的955个连接组、来自ADNI的57个、来自Calgary Preschool数据集reynolds2020calgary的87个、来自儿科VUMC数据集ds004146:1\.0\.0的373个、来自多感觉词汇处理队列ds001894:1\.4\.2的111个、来自MASiVards003416:2\.0\.2的80个、来自纵向语言发展研究ds003604:1\.0\.7的236个、来自QTABds004146:1\.0\.3的398个、来自HABSHDpetersen2025health的2,486个、来自WRAPjohnson2018wisconsin的339个、来自NACC的1,006个,以及来自ROS/MAP/MARS联合队列bennett2005rush;a2012overview;l2012minority的610个。跨数据集,我们将站点定义为唯一的扫描仪-协议配对,共得到25个不同的站点。汇总样本包括4,490名女性和2,926名男性(年龄2至102岁),包括神经典型参与者(n=5,900)以及诊断为轻度认知障碍(MCI;n=877)和阿尔茨海默病(AD;n=639)的个体。

所有影像数据均按照kim2025scalable进行预处理。弥散MRI扫描通过PreQual流程cai2021prequal进行校正和标准化。结构MRI体积使用SLANT脑部分割算法huo20193d分割为121个BrainColor区域。在MRtrix3tournier2012mrtrix中估计纤维方向分布并进行全脑概率纤维束成像,种子点位于白质-灰质界面,每位参与者生成1000万条流线。通过计算所有SLANT定义ROI对之间的流线终止次数构建结构连接组。在每个处理阶段,根据kim2025scalable中的最佳实践进行视觉质量保证。

### 2.2JointVAE

传统变分自动编码器(VAE)由编码器q_φ(·)(参数化为φ)和解码器p_θ(·)(参数化为θ)组成,其中编码器将输入数据x映射到低维潜表示z,解码器将输入重建为x̂。为了防止潜空间变得任意分散或碎片化,后验分布q_φ(z|x)被鼓励与先验分布匹配,通常是标准正态分布p(z)=N(0,I)。在此公式下,传统VAE优化目标变为:

L(θ,φ)=E_{q_φ(z|x)}[log p_θ(x|z)] - D_KL(q_φ(z|x) || p(z))。 (1)

Joint-VAEdupont2018learning通过增加一个额外的离散组件扩展了传统VAE框架。令z_c表示连续潜变量,z_d表示离散潜变量。编码器现在估计联合后验分布q_φ(z_c,z_d|x),而解码器通过p_θ(x|z_c,z_d)从两个潜组件重建输入。通过此公式,Joint-VAE目标变为:

L(θ,φ)=E_{q_φ(z_c,z_d|x)}[log p_θ(x|z_c,z_d)] - D_KL(q_φ(z_c,z_d|x) || p(z_c,z_d))。 (2)

由于q_φ(z_c|x)和q_φ(z_d|x)由编码器作为单独分布产生,后验可以分解为q_φ(z_c,z_d|x)=q_φ(z_c|x)q_φ(z_d|x),并且使用标准因式分解先验p(z_c,z_d)=p(z_c)p(z_d),KL散度分解为两项。

D_KL(q_φ(z_c,z_d|x) || p(z_c,z_d)) = D_KL(q_φ(z_c|x) || p(z_c)) + D_KL(q_φ(z_d|x) || p(z_d))。 (3)

因此,Joint-VAE训练的最终目标变为:

L(θ,φ)=E_{q_φ(z_c,z_d|x)}[log p_θ(x|z_c,z_d)] - β_c D_KL(q_φ(z_c|x) || p(z_c)) - β_d D_KL(q_φ(z_d|x) || p(z_d)), (4)

其中β_c和β_d允许对连续和离散KL项进行单独加权。然而,由于连续潜空间原则上具有比离散空间更大的容量,直接优化此损失通常会导致模型将所有信息放入连续潜变量z_c中,而忽略离散潜变量z_d。

相似文章

元学习上下文学习实现无需训练的跨被试脑解码

Hugging Face Daily Papers

# 论文页面 - 元学习上下文学习实现无需训练的跨被试脑解码 来源:[https://huggingface.co/papers/2604.08537](https://huggingface.co/papers/2604.08537) 作者:,,,,,,,,,,,,, ## 摘要 一种元优化方法通过少量图像-脑示例快速推断个体独特神经编码模式,无需跨被试及扫描仪微调,即可实现可泛化的语义视觉解码。[视觉解码](https://huggingface.co/papers?q

修正影响:利用正交潜在空间解构LLM输出

arXiv cs.LG

本文介绍了一个框架,通过稀疏自编码器学习正交潜在空间,实现对大型语言模型中词元级影响的归因,从而精确识别共同影响预测的训练数据词元,适用于医疗等高风险领域。

信念还是电路?上下文图学习的因果证据

arXiv cs.AI

本文使用主成分分析(PCA)和激活补丁等机制可解释性方法,在一个图随机游走任务上探究了大型语言模型是通过潜在结构推断还是局部模式匹配来进行上下文学习。