通过智能分区实现深度脑电去噪器的无监督训练

arXiv cs.LG 论文

摘要

本文提出了一种名为智能分区自监督去噪(iPSD)的方法,该方法通过在不需干净参考数据的情况下对噪声片段进行分区,实现了深度脑电去噪器的无监督训练。

arXiv:2605.06724v1 公告类型:新论文 摘要:对可穿戴脑电图(EEG)进行去噪本质上极具挑战性,因为神经活动不仅微弱,而且与频谱重叠的噪声伪迹密不可分。传统的信号处理方法依赖固定或启发式规则,无法处理可穿戴脑电中普遍存在的时变伪迹。另一方面,深度学习方法利用高表达力的神经网络,在无分解的脑电去噪方面展现出潜力,但其训练需要无伪迹的脑电数据,而这在本质上是不可获得的。为解决这一问题,我们提出了智能分区自监督去噪(iPSD)。我们的方法通过学习将输入脑电片段划分为具有相同底层信号的独立噪声实例,从而消除了对干净参考数据的需求。这使得即使在仅有一个待去噪脑电片段的零样本设置下,也能实现深度学习去噪器的自监督。我们通过广泛的实验验证了 iPSD,包括对来自入耳式传感器的可穿戴脑电数据的验证。结果表明,iPSD 达到了最先进的性能,尤其是在极低信噪比(低至 -10 dB)和具有挑战性的伪迹(例如肌电伪迹)下表现尤为突出,其频谱保真度比竞争性基线高出几个数量级。
查看原文
查看缓存全文

缓存时间: 2026/05/11 06:42

# 通过智能分区实现深度脑电去噪器的无监督训练

来源:https://arxiv.org/html/2605.06724
Qiyu Rao$^{1}$, Haozhe Tian$^{2}$, Homayoun Hamedmoghadam$^{1}$, Danilo Mandic$^{1}$
$^{1}$ 帝国理工学院电子与电气工程系
$^{2}$ 帝国理工学院戴森设计工程学院
{kianna.rao21, haozhe.tian21, h.hamed, danilo.mandic}@imperial.ac.uk

###### 摘要

可穿戴脑电图(EEG)的去噪本质上具有挑战性,因为神经活动不仅微弱,而且与频谱重叠的噪声伪影不可分离。依赖于固定或启发式规则的经典信号处理方法无法处理可穿戴 EEG 中随时间变化的普遍伪影。另一方面,深度学习方法利用高度表达力的神经网络,在无分解的 EEG 去噪方面显示出前景,但其训练需要无伪影的 EEG,而这在本质上是不可能获得的。为了解决这一问题,我们提出了用于自监督去噪的智能分区(Intelligent Partitioning for Self-supervised Denoising, iPSD)。我们的方法通过学习将输入 EEG 片段分区为具有相同底层信号的独立噪声实现,从而消除了对干净参考信号的需求。这使得即使在仅有一个待去噪 EEG 片段的零样本(zero-shot)设置中,也能实现深度学习去噪器的自监督。我们通过广泛的实验验证了 iPSD,包括对来自耳内传感器的可穿戴 EEG 的验证。结果表明,iPSD 达到了最先进的性能,特别是在极低信噪比(低至 $-10$ dB)和具有挑战性的伪影(如肌电伪影 EMG)下,其频谱保真度比竞争性基线高出几个数量级。

## 1 引言

可穿戴技术正在改变连续健康监测,在心电图(ECG)[1](https://arxiv.org/html/2605.06724#bib.bib1)和光电容积脉搏波(PPG)[2](https://arxiv.org/html/2605.06724#bib.bib2)追踪方面取得了显著进展。然而,可穿戴脑电图(EEG)监测的进展相对缓慢:除了可穿戴记录固有的电极-皮肤接触不良、运动伪影和生理干扰外,脑信号本身也是微弱、宽带且非平稳的[3](https://arxiv.org/html/2605.06724#bib.bib3), [4](https://arxiv.org/html/2605.06724#bib.bib4), [5](https://arxiv.org/html/2605.06724#bib.bib5)。

为了解决通过分解和选择性重建来去噪 EEG 的问题,已经提出了一系列信号处理方法。离散小波变换使用小波基分解信号,并通过阈值化小波系数重构去噪版本[6](https://arxiv.org/html/2605.06724#bib.bib6), [7](https://arxiv.org/html/2605.06724#bib.bib7)。然而,当噪声频谱与 EEG 频谱重叠时,这种方法效果不佳,例如来自肌肉收缩的肌电(EMG)伪影,这是可穿戴记录中常见的噪声源。模态分解方法通过将信号分解为数据驱动的模态函数部分缓解了这一问题[8](https://arxiv.org/html/2605.06724#bib.bib8), [9](https://arxiv.org/html/2605.06724#bib.bib9)。然而,它们对超参数选择以及可穿戴 EEG 中常见的突变扰动非常敏感。

深度学习(DL)为基于分解的去噪提供了一种引人注目的替代方案,因为高度表达力的神经网络可以直接将噪声 EEG 映射到其干净对应物,而无需任何固定或启发式基[10](https://arxiv.org/html/2605.06724#bib.bib10), [11](https://arxiv.org/html/2605.06724#bib.bib11), [12](https://arxiv.org/html/2605.06724#bib.bib12), [13](https://arxiv.org/html/2605.06724#bib.bib13)。然而,DL 去噪器的监督训练需要干净的参考记录,这是无法实现的,因为在测量点神经信号与生理和环境噪声不可分离。自监督方法仅使用独立的噪声实现,已被证明对图像去噪有效,取得了巨大成功的 Noise2Noise (N2N)[14](https://arxiv.org/html/2605.06724#bib.bib14)方法。N2N 通过训练神经网络将图像的一个噪声实现映射到另一个来学习恢复干净图像。Mansour 和 Heckel[15](https://arxiv.org/html/2605.06724#bib.bib15)后来将 N2N 扩展到没有同一图像多次测量的设置,通过交错下采样,将交替像素分配给两个子图像以形成一对噪声实现。然而,这一启发式方法不能直接转移到 EEG:与局部平滑的图像不同,EEG 的快速振荡结构导致交错下采样产生具有不同底层干净信号的实现,从而违反了 N2N 的核心假设。

为了解决自监督恢复干净 EEG 信号的挑战,我们提出了用于自监督去噪的智能分区(iPSD)。其核心思想是学习将噪声输入的样本分配到两个具有相同底层干净信号的子信号中。(不同于通过预定规则(如交错下采样)进行分配,智能分区使学习灵活、特定于信号的分配成为可能。)这两个子信号随后作为 N2N 风格自监督去噪的一对噪声实现。其直觉是,对于两个共享相同干净信号但携带独立噪声的子信号,一个信号中的噪声无法从另一个信号中预测;因此,训练去噪网络将一个子信号映射到另一个子信号会驱动其收敛到输出它们的共享分量,即干净信号。在 iPSD 中,分区通过强化学习(RL)与去噪器联合优化,使用收敛去噪损失的负值作为奖励信号。我们在[第 2.2 节](https://arxiv.org/html/2605.06724#S2.SS2)中表明,在合理的假设下,这驱动分区模块走向最能提供彼此底层信号信息的子信号。我们还开发了一种名为 iPSD-Zero 的零样本变体,无需任何先验训练即可从单个噪声片段中恢复干净信号。

我们在受白高斯噪声(WGN)和现实世界 EMG 伪影污染的 EEG 信号上评估了 iPSD,噪声水平高达信号功率的十倍,以及来自定制构建的耳内传感器的真实噪声可穿戴 EEG 数据[16](https://arxiv.org/html/2605.06724#bib.bib16), [17](https://arxiv.org/html/2605.06724#bib.bib17)。在所有条件下,iPSD 始终优于其他方法,其频谱保真度比现有基线高出几个数量级。在下游睡眠阶段分类任务中,经 iPSD 去噪的可穿戴 EEG 达到了与临床级头皮 EEG 相当的准确性,突显了该方法在可及健康监测中的实用价值。据我们所知,iPSD 是第一个在不同噪声类型、SNR 水平和现实世界可穿戴记录中证明如此有效的自监督 EEG 去噪方法。

## 2 方法论

令 $\mathbf{x} \in \mathbb{R}^L$ 表示长度为 $L$ 的干净 EEG 信号,令 $\mathbf{s} = \mathbf{x} + \mathbf{n}$ 为 $\mathbf{x}$ 的受噪声污染的测量值,其中 $\mathbf{n} \in \mathbb{R}^L$ 表示与 $\mathbf{x}$ 独立的加性噪声,即 $\mathbb{E}[\mathbf{n}^\top \mathbf{x}] = 0$。去噪然后指从其噪声测量值 $\mathbf{s}$ 中恢复底层干净信号 $\mathbf{x}$。我们关注深度学习去噪器,它们利用表达力强的神经网络直接将噪声 $\mathbf{s}$ 映射到其干净估计值 $\hat{\mathbf{x}}$,绕过经典信号处理的固定或启发式基。

### 2.1 iPSD 公式化

在大多数实际场景中,干净参考 $\mathbf{x}$ 不可用,使得去噪器的监督训练不可行。与图像或音频不同,其中干净参考信号可以合成生成,EEG 记录本质上是受污染的。这是因为在采集点,真实的神经信号 $\mathbf{x}$ 与生理和环境噪声不可分离,无论测量设备多么精确。iPSD 的设计针对这一根本受限的设置进行了优化,其中真实目标在物理上不可访问,而不仅仅是稀缺。

> [图 1: iPSD 示意图概述。分区模块 $\pi_\psi$ 将输入信号分为两个子信号 $\mathbf{s}^l$ 和 $\mathbf{s}^r$,由去噪模块 $f_\theta$ 进行去噪。$f_\theta$ 的训练使用自监督 N2N 损失 $\|f_\theta(\mathbf{s}^l) - \mathbf{s}^r\|_2^2 + \|f_\theta(\mathbf{s}^r) - \mathbf{s}^l\|_2^2$。收敛的 $f_\theta$ 损失的负值随后用作更新 $\pi_\psi$ 的奖励。我们交替更新 $\pi_\psi$ 和 $f_\theta$ 直到收敛。]

[图 1](https://arxiv.org/html/2605.06724#S2.F1) 中的示意图描述了 iPSD 的架构,它由两个可学习模块组成:*分区模块*接收噪声输入 $\mathbf{s}$ 并使用由 $\psi$ 参数化的神经网络 $\pi_\psi$ 生成一对噪声子信号 $(\mathbf{s}^l, \mathbf{s}^r)$;*去噪模块*使用由 $\theta$ 参数化的神经网络 $f_\theta$ 将噪声信号映射到其干净估计值。两个神经网络的参数通过以下自监督目标联合优化:

$$
\theta^\star, \psi^\star = \operatorname*{argmin}_{\theta, \psi} \mathbb{E}_{(\mathbf{s}^l, \mathbf{s}^r) \sim \pi_\psi(\cdot \mid \mathbf{s})} \left[ \|f_\theta(\mathbf{s}^l) - \mathbf{s}^r\|_2^2 + \|f_\theta(\mathbf{s}^r) - \mathbf{s}^l\|_2^2 \right]. \tag{1}
$$

#### 2.1.1 自监督去噪

[方程 1](https://arxiv.org/html/2605.06724#S2.E1) 中的目标仅使用噪声子信号 $(\mathbf{s}^l, \mathbf{s}^r)$ 训练去噪模块 $f_\theta$,无需干净参考。当两个子信号共享相同的底层干净信号时,这种自监督是有效的:$\mathbf{s}^l$ 和 $\mathbf{s}^r$ 中的独立噪声分量彼此不可预测,因此训练 $f_\theta$ 将一个子信号映射到另一个子信号会驱动其输出它们的共享分量,即干净信号。以下定理改编自 [15](https://arxiv.org/html/2605.06724#bib.bib15),形式化了这一直觉:

###### 定理 1.

假设 $(\mathbf{s}^l, \mathbf{s}^r) \sim \pi_\psi(\cdot \mid \mathbf{s})$ 是相同底层信号 $\mathbf{x}$ 的独立噪声实现。那么优化 [方程 1](https://arxiv.org/html/2605.06724#S2.E1) 中自监督损失的 $\theta^\star$ 也最小化了网络输出与真实值 $\mathbf{x}$ 之间的期望 $L_2$ 距离,即:

$$
\theta^\star = \operatorname*{argmin}_{\theta} \, \mathbb{E}\Big[ \big\|f_\theta(\mathbf{s}^l) - \mathbf{x}\big\|_2^2 + \big\|f_\theta(\mathbf{s}^r) - \mathbf{x}\big\|_2^2 \Big].
$$

[定理 1](https://arxiv.org/html/2605.06724#Thmtheorem1) 的证明提供在[附录 A](https://arxiv.org/html/2605.06724#A0.SS1)中。该定理表明,给定分区 $(\mathbf{s}^l, \mathbf{s}^r)$,$f_\theta$ 可以通过对以下损失进行梯度下降来优化:

$$
\mathcal{L}(\theta) = \|f_\theta(\mathbf{s}^l) - \mathbf{s}^r\|_2^2 + \|f_\theta(\mathbf{s}^r) - \mathbf{s}^l\|_2^2. \tag{2}
$$

关键的是,这种自监督训练方案的有效性取决于两个子信号 $(\mathbf{s}^l, \mathbf{s}^r)$ 共享相同的底层干净信号。对于 EEG 来说,由于其非平稳性和快速振荡结构,实现这一点特别具有挑战性,需要灵活、有针对性的分区策略。这促使我们将 iPSD 的核心设计为可学习的分区模块。

#### 2.1.2 智能分区

这里,我们描述从输入噪声信号 $\mathbf{s}$ 获取配对 $(\mathbf{s}^l, \mathbf{s}^r)$ 的分区模块(参见[图 2](https://arxiv.org/html/2605.06724#S2.F2))。这里结合了两个想法:(i)将输入分割成底层信号近似平稳的小窗口,以及(ii)模型 $\pi_\psi$ 学习如何最佳分区每个窗口以优化去噪性能,通过随机探索所有候选分区。

形式上,输入 $\mathbf{s} \in \mathbb{R}^L$,索引集 $I=\{1, \cdots, L\}$,被分割成适当偶数长度 $W$(整除 $L$)的不重叠局部窗口。第 $k$ 个窗口的索引集为 $I^{(k)} = \{(k-1)W+1, \cdots, kW\}$,其中 $k=1, \cdots, L/W$。分区模型 $\pi_\psi$ 学习从每个 $I^{(k)}$(对应于窗口 $k$)中提取一个子集 $I^{(k),l}$,限制其基数为 $W/2$(因此其补集为 $I^{(k),r} = I^{(k)} \setminus I^{(k),l}$)。我们使用 $(\mathbf{s}^l, \mathbf{s}^r) \sim \pi_\psi(\cdot \mid \mathbf{s})$ 表示根据随机策略 $\pi_\psi: \mathbb{R}^L \rightarrow \mathcal{P}(I^l)$ 提取信号对 $(\mathbf{s}^l, \mathbf{s}^r)$:

$$
\mathbf{s}^l = [s_i]_{i \in I^l} \in \mathbb{R}^{L/2}, \qquad \mathbf{s}^r = [s_i]_{i \in I^r} \in \mathbb{R}^{L/2}, \tag{3}
$$

其中 $I^l = \bigcup_{k=1}^{L/W} I^{(k),l}$ 且 $I^r = \bigcup_{k=1}^{L/W} I^{(k),r}$。

> [图 2: 分区模块的工作流程。长度为 $L$ 的输入信号 $\mathbf{s}$ 被重塑为 $L/W$ 个长度为 $W$ 的不重叠窗口,每个窗口允许 $\binom{W}{W/2}/2$ 个候选分区为两个等长子集。模型 $\pi_\psi$ 为每个窗口选择一个分区,相应的子集跨窗口连接以形成子信号对。去噪模块 $f_\theta$ 随后处理子信号并提供用于优化 $\pi_\psi$ 的反馈(参见[图 1](https://arxiv.org/html/2605.06724#S2.F1))。]

###### 命题 1.

对于任何信号窗口 $I^{(k)}$,iPSD 中使用的窗口内分区策略在子信号 $(\mathbf{s}_{I^{(k),l}}, \mathbf{s}_{I^{(k),r}})$ 的底层干净分量之间的不匹配方面,总是能实现至少与 [15](https://arxiv.org/html/2605.06724#bib.bib15) 中使用的交错分区一样好的分区。

我们在[附录 B](https://arxiv.org/html/2605.06724#A0.SS2)中提供了[命题 1](https://arxiv.org/html/2605.06724#Thmproposition1)的详细证明。

### 2.2 训练 iPSD

相似文章