超越增强:评分引导的病理先验用于基于EEG的抑郁症检测

arXiv cs.LG 论文

摘要

本文介绍了评分引导分类(SGC),这是一种利用无监督生成网络对基于EEG的抑郁症检测中的病理先验进行建模的框架,避免了合成数据增强,并提高了分类准确性。

arXiv:2606.00180v1 公告类型:新 摘要:基于深度学习的使用脑电图(EEG)进行重度抑郁症(MDD)检测受到“小样本困境”的根本限制。主流的生成式数据增强方法不仅计算开销大,而且存在引入合成噪声的风险,从而模糊分类边界。为了挑战传统的“数据量优先”惯例,我们提出了一种新颖的框架“超越增强”:评分引导分类(SGC)。SGC并不合成伪样本,而是利用无监督生成网络架构对样本的结构和统计异常程度进行建模,作为核心的“病理先验”。该先验经过稳健归一化后,与深度特征表示显式融合,从而精确引导分类器的决策边界。此外,为了动态适应不同的通道配置,我们提出了一个跨通道空间自适应模块,利用空间映射机制有效解决多中心数据集中通道不匹配的硬件异质性。在Mumtaz2016和高密度MODMA数据集上的大量实验表明,我们的方法在具有挑战性的“零数据增强”设置和“零样本合成成本”下具有有效性和卓越的泛化能力。 关键词:脑电图(EEG),抑郁症检测,异常评分,扩散模型,少样本学习
查看原文
查看缓存全文

缓存时间: 2026/06/02 15:39

# 超越数据增强:基于评分引导的病理先验用于脑电图抑郁症检测
来源:https://arxiv.org/html/2606.00180
程景琦 安徽大学互联网学院 中国合肥 [email protected] (https://arxiv.org/html/2606.00180v1/mailto:[email protected]), 赵旭 安徽大学互联网学院 中国合肥, 江婉 合肥工业大学计算机科学与技术学院 中国合肥, 吴晶晶 合肥工业大学计算机科学与信息工程学院 中国合肥

\(2026\)

###### 摘要.

基于深度学习的脑电图 (EEG) 重度抑郁症 (MDD) 检测从根本上受限于小样本困境。流行的生成式数据增强方法不仅带来沉重的计算开销,还会引入合成噪声,从而模糊分类边界。为了挑战传统的“数据量优先”惯例,我们提出了一种新颖的框架:评分引导分类 (Score-Guided Classification, SGC)。SGC 并不合成伪样本,而是利用无监督生成网络架构对样本的结构和统计异常程度进行建模,将其作为核心病理先验。该先验经过稳健归一化后,与深度特征表示显式融合,从而精确引导分类器的决策边界。此外,为了动态适应不同的电极配置,我们提出了跨电极空间自适应模块,利用空间映射机制有效解决多中心数据集中不匹配电极的硬件异质性。在 Mumtaz2016 和高密度 MODMA 数据集上的大量实验证明了我们的方法在零数据增强设置和零样本合成成本下具有有效性和优异的泛化能力。

脑电图 (EEG), 抑郁症检测, 异常评分, 扩散模型, 少样本学习

††copyright:none††copyright:acmlicensed††journalyear:2026††doi:10.1145/nnnnnnn.nnnnnnn††conference:第34届ACM国际多媒体会议;2026年;地点待定††isbn:978-1-4503-XXXX-X/2026††submissionid:4768††ccs:计算方法 异常检测††ccs:应用计算 健康信息学

## 1. 引言

参考图标题图1. 标准扩散增强中的生成缺陷。与真实的脑电图(上/中)相比,生成的伪信号存在严重的高频伪影和形态失真。这种退化在KDE图中通过显著的数据分布偏移(Δσ=0.73)得到定量证实,表明合成样本无法保留神经活动固有的统计流形。

开发稳健的计算架构来解码脑电图 (EEG) 信号正成为客观诊断重度抑郁症 (MDD) 的关键前沿 (Xu 等, 2026 (https://arxiv.org/html/2606.00180#bib.bib1))。这一范式从根本上解决了传统精神科访谈的局限性,后者天生容易受到主观偏差和评估者间变异性的影响。通过提供卓越的时间分辨率,EEG 为潜在的皮层动力学提供了直接、无创的窗口 (Leccisotti 等, 2026 (https://arxiv.org/html/2606.00180#bib.bib2))。因此,基于 EEG 的抑郁症检测任务在精神信息学和临床筛查中引起了广泛关注。

为了处理这些复杂的非平稳信号,当代基于 EEG 的 MDD 检测方法通常分为三种表示范式。时间序列建模利用一维卷积神经网络 (1D-CNN) (Seal 等, 2021 (https://arxiv.org/html/2606.00180#bib.bib69)) 或循环神经网络 (RNN) (Ay 等, 2019 (https://arxiv.org/html/2606.00180#bib.bib62)) 直接从原始一维 EEG 序列中提取纵向形态特征。空间图像变换将 EEG 信号映射为二维频谱图或拓扑表示,以利用二维卷积神经网络 (2D-CNN) 强大的视觉特征提取能力 (Sharma 等, 2023 (https://arxiv.org/html/2606.00180#bib.bib74))。最后,时空和拓扑建模采用图神经网络 (GNN) (Luo 等, 2023 (https://arxiv.org/html/2606.00180#bib.bib70)) 或 Transformer 来联合捕获动态时间依赖性和复杂的跨电极功能连接 (Chen and Yang, 2025 (https://arxiv.org/html/2606.00180#bib.bib75))。通过自主挖掘这些层次化表示,这些先进架构显著提升了自动化抑郁症检测的诊断性能。

尽管性能提升显著,但这些纯粹的端到端监督范式在实际临床应用中存在关键弱点,主要在于它们容易受到捷径学习的影响。EEG 信号天生受到极端非平稳性、显著的受试者间变异性和极低信噪比的困扰 (Lyu, 2026 (https://arxiv.org/html/2606.00180#bib.bib5))。因此,将这些混沌信号直接映射到离散标签,会迫使参数庞大的网络退化为不可解释的黑箱 (Hamed 等, 2026 (https://arxiv.org/html/2606.00180#bib.bib6))。如果没有明确的病理先验指导,模型容易过度拟合特定受试者的生理伪影,而不是分离出通用的神经生理生物标志物。这种对特异性噪声的过拟合会产生高度脆弱的决策边界,常常导致跨中心泛化能力的灾难性下降 (Lawal 等, 2026 (https://arxiv.org/html/2606.00180#bib.bib7); Wong 等, 2026 (https://arxiv.org/html/2606.00180#bib.bib8))。

加剧这些表示瓶颈的是精神科 EEG 数据集普遍存在的严重小样本困境,这些数据集通常包含不到 100 名受试者 (Hallal 等, 2026 (https://arxiv.org/html/2606.00180#bib.bib9))。为了规避数据稀缺问题,近期文献越来越转向深度生成模型,包括图神经网络 (GNN) (Luo 等, 2023 (https://arxiv.org/html/2606.00180#bib.bib70)) 和扩散模型 (Zhao 等, 2024 (https://arxiv.org/html/2606.00180#bib.bib40); Zhou 等, 2023 (https://arxiv.org/html/2606.00180#bib.bib41)),用于暴力数据增强 (Mirowski and Fabijańska, 2026 (https://arxiv.org/html/2606.00180#bib.bib10))。然而,直接合成高维、非平稳的原始 EEG 信号引入了致命的方法缺陷。如图 1 (https://arxiv.org/html/2606.00180#S1.F1) 所令人信服地展示的那样,直接合成的伪信号受到密集的高频生成伪影和严重形态失真的困扰 (Zhang 等, 2026 (https://arxiv.org/html/2606.00180#bib.bib11))。至关重要的是,这些幻觉样本与真实数据流形之间存在显著的数据分布偏移(Δσ=0.73)。因此,这种噪声增强范式积极注入虚假相关性,误导下游分类器记忆合成噪声分布而非临床有意义的生物标志物 (Choi 等, 2026 (https://arxiv.org/html/2606.00180#bib.bib13))。

为了从根本上规避判别式黑箱的表示瓶颈和生成式增强中固有的灾难性噪声注入,我们提出了一种超越数据增强的新颖框架:评分引导分类 (Score-Guided Classification, SGC)。与盲目幻觉原始 EEG 的现有范式不同,SGC 通过建模一个规范的电生理基线重新定义了生成效用的内涵。具体来说,我们设计了一个仅在健康对照组 (HC) 队列上训练的无监督双流生成管道,以锚定正常大脑动力学的内在流形。为了全面捕获这一规范基线,双流架构被精心构建:一个流显式建模健康信号的离散结构形态,而互补的流捕获其连续概率分布。对于任何输入,SGC 都会量化相对于该冻结模板的结构重构误差和概率分布偏移,提炼出一个细粒度的异常评分 (Rutherford 等, 2022 (https://arxiv.org/html/2606.00180#bib.bib18))。这个连续的评分作为确定性的、无噪声的病理先验,被显式融合到下游深度分类器中,以动态校准决策边界,有效将真正的 MDD 生物标志物与复杂的背景变异分离开来。

除了表示挑战之外,基于 EEG 的诊断在实际临床部署中常常受到硬件层面数据异质性的瓶颈,例如临床中心之间不同的电极配置(范围从 19 到 128 通道)。为了使 SGC 架构具备硬件无关的泛化能力,我们引入了一种连续空间拓扑映射策略。通过将任意高密度原始信号几何投影到一个统一的标准电极布局上,该机制最大程度地保留了大脑的全局生物物理拓扑结构。至关重要的是,它消除了架构级结构重新训练的必要性,从而解锁了跨高度异质临床环境的无缝零样本迁移和稳健的跨数据集适应。

总之,我们的贡献是:

• 我们提出了评分引导分类 (Score-Guided Classification, SGC),一种新颖的无数据增强框架,通过无监督双流架构从健康对照组建模规范 EEG 基线,并利用由此产生的病理先验,通过重塑特征流形和扩大决策边界来增强下游抑郁症检测。

• 我们引入了一种空间拓扑映射策略,将不匹配的电极投影到统一布局上。这解决了跨队列硬件异质性,并在无需架构重新训练的情况下实现了无缝的零样本迁移。

• 在 Mumtaz2016 和 MODMA 上的广泛评估取得了最先进的性能(95.19% 准确率),实证验证了提取显式病理先验本质上比标准生成式数据增强更稳健。

参考图标题图2. 评分引导分类 (SGC) 框架的整体架构。无监督流(上)使用 VQ-VAE 和 DDPM 专门建模规范性健康基线。监督流(下)利用这个冻结的基线提取传入样本的病理异常评分 (S′),同时并行捕获深度时空特征 (Fdeep)。后期特征融合将 S′ 整合进来,以精确引导最终的决策边界。

## 2. 相关工作

### 2.1. 基于 EEG 的抑郁症检测

自动重度抑郁症 (MDD) 检测领域经历了从传统手工频谱特征工程到数据驱动深度学习架构的重大范式转变。近期文献广泛探索了各种深度框架,包括一维卷积神经网络 (1D-CNN)、图神经网络 (GNN) 和基于 Transformer 的模型,以捕获 EEG 信号中复杂的时空动力学和跨通道拓扑依赖性 (Lu 等, 2024 (https://arxiv.org/html/2606.00180#bib.bib21); Peng 等, 2025 (https://arxiv.org/html/2606.00180#bib.bib22); Singh 等, 2024 (https://arxiv.org/html/2606.00180#bib.bib23); Wang 等, 2024c (https://arxiv.org/html/2606.00180#bib.bib24); Hou 等, 2025 (https://arxiv.org/html/2606.00180#bib.bib25); Sun 等, 2026 (https://arxiv.org/html/2606.00180#bib.bib26))。尽管具有令人印象深刻的表示能力,但这些纯粹监督的、参数庞大的范式极易受到严重过拟合的影响,尤其是在临床精神科数据集普遍存在的小样本场景下部署时 (Zhulduzbayev 等, 2026 (https://arxiv.org/html/2606.00180#bib.bib27); Liu 等, 2022 (https://arxiv.org/html/2606.00180#bib.bib28); Vaniya 等, 2026 (https://arxiv.org/html/2606.00180#bib.bib29); Olbrich 等, 2026 (https://arxiv.org/html/2606.00180#bib.bib30))。因此,它们在受试者独立泛化场景中经常表现出显著的性能下降 (Shen 等, 2025 (https://arxiv.org/html/2606.00180#bib.bib31); Wang 等, 2024a (https://arxiv.org/html/2606.00180#bib.bib32); Li 等, 2024 (https://arxiv.org/html/2606.00180#bib.bib33); Kim 等, 2025 (https://arxiv.org/html/2606.00180#bib.bib34))。这一固有限制强调了超越简单端到端监督分类边界的新颖表示学习策略的关键必要性。

### 2.2. EEG 分析中的数据增强

为了缓解 EEG 评估中普遍存在的数据稀缺问题,大量研究致力于数据增强技术,这些技术大致分为启发式方法和生成式方法。传统的启发式方法,如随机裁剪、时间掩码或信号翻转,试图扩展训练流形,但经常违反 EEG 记录复杂的生物物理完整性,无意中引入语义畸变和相位耦合破坏 (Rommel 等, 2022 (https://arxiv.org/html/2606.00180#bib.bib36); Lashgari 等, 2020 (https://arxiv.org/html/2606.00180#bib.bib35); Liao 等, 2025 (https://arxiv.org/html/2606.00180#bib.bib37); Lee 等, 2026 (https://arxiv.org/html/2606.00180#bib.bib38))。为了规避这些手工限制,近期进展越来越多地利用深度生成架构,特别是生成对抗网络 (GAN) (Hartmann 等, 2018 (https://arxiv.org/html/2606.00180#bib.bib39)) 和去噪扩散概率模型 (DDPM) (Zhao 等, 2024 (https://arxiv.org/html/2606.00180#bib.bib40); Zhou 等, 2023 (https://arxiv.org/html/2606.00180#bib.bib41)),来合成高保真伪样本。然而,在超低数据场景中部署这些生成框架会引入严重的方法瓶颈 (Wang 等, 2026 (https://arxiv.org/html/2606.00180#bib.bib44))。正如我们在初步分析中通过实验证明的那样(见图 1 (https://arxiv.org/html/2606.00180#S1.F1)),在有限的 EEG 队列上进行基于扩散的合成会导致显著的高频噪声放大以及与真实数据流形之间的显著分布偏移(Δσ)(He 等, 2021 (https://arxiv.org/html/2606.00180#bib.bib42); Lin 等, 2024 (https://arxiv.org/html/2606.00180#bib.bib43))。这种噪声数据扩展非但没有锐化决策边界,反而不可逆地模糊了它们。与这些以增强为中心的范式相反,我们的 SGC 框架从根本上将重点转移到无监督特征挖掘上,完全绕过了与幻觉原始信号生成相关的风险。

### 2.3. 作为病理先验的异常检测

传统的异常检测 (AD) 框架通常将病理偏差简化为用于离群点拒绝的硬阈值 (Fernando 等, 2021 (https://arxiv.org/html/2606.00180#bib.bib45); An and Cho, 2015 (https://arxiv.org/html/2606.00180#bib.bib46); Bauer 等, 2018 (https://arxiv.org/html/2606.00180#bib.bib47)),未能充分利用生成式表示。它们依赖于整体重构误差或浅层统计距离,很容易被混杂因素干扰。

相似文章

评估区域级脑电图对认知负荷预测的贡献

arXiv cs.LG

本文提出了一种基于脑电图的认知负荷预测的区域级评估框架,表明额叶电极组在使用较少电极的情况下,在排名位置上比全头皮基线高出15-20%,支持高效的工作负荷监测系统。

EEG基础模型中的身份陷阱:诊断性审计

arXiv cs.LG

本文识别并诊断了EEG基础模型中的“身份陷阱”,即高准确率可能源于受试者身份特征而非真实的临床生物标志物。它提出了FMScope,一种冻结表示协议以分离这些信号,并证明了受试者身份混杂在三模型中普遍存在且可通过线性方法移除。