一种冲突感知的证据框架用于可靠的睡眠阶段分类

arXiv cs.AI 论文

摘要

ConfSleepNet 是一种冲突感知的证据框架,使用多模态数据进行可靠的睡眠阶段分类。它引入了混合类别结构和冲突感知聚合方法来解决视角间冲突,在睡眠分期任务上展示了有效性。

arXiv:2605.17021v1 公告类型:新 摘要:多视图学习已被广泛应用于使用多模态数据进行睡眠阶段分类。然而,现有方法通常假设不同模态之间良好对齐,这在现实场景中往往难以实现,从而损害了分期结果的可靠性。本文提出 ConfSleepNet,一种冲突感知的证据框架,能够动态解决视角间冲突。该框架包括多视图证据提取和冲突感知聚合两个阶段。第一阶段,从不同模态学习类别相关证据,表示对各个睡眠阶段的支持程度。考虑到不同模态的固有特性,我们针对不同模态提出混合类别结构,以促进更合理的证据学习。第二阶段,从学习到的证据中构建视图特定意见,包括预测结果和不确定性。值得注意的是,我们提出了一种新颖的冲突感知聚合方法,将这些视图特定意见整合为可靠的联合决策。该机制能够有效解决意见之间的冲突,并将其合成为可靠的联合决策。理论分析和实验结果均证明了 ConfSleepNet 在睡眠分期任务上的有效性。代码可在 https://github.com/By4te/ConfSleepNet_ICML2026/ 获取。
查看原文
查看缓存全文

缓存时间: 2026/05/19 06:38

# 面向可靠睡眠分期的一致性感知证据框架 来源:https://arxiv.org/html/2605.17021 ###### 摘要 多视图学习已广泛应用于基于多模态数据的睡眠分期分类。然而,现有方法通常假设不同模态之间具有良好的对齐性,这在现实场景中往往难以实现,从而影响分期结果的可靠性。本文提出 ConfSleepNet,一种能够动态解决视图间冲突的一致性感知证据框架。该框架包括多视图证据提取和一致性感知聚合两个阶段。在第一阶段,从不同模态中学习与类别相关的证据,这些证据表示对各个睡眠阶段的支持程度。考虑到不同模态的固有特征,我们针对不同模态提出了混合类别结构,以促进更合理的证据学习。在第二阶段,基于学习到的证据构建包含预测结果和不确定性的视图特定意见。值得注意的是,我们提出了一种新颖的一致性感知聚合方法,将这些视图特定意见整合为可靠的联合决策。该机制能够有效解决意见间的冲突,并将其综合为可靠的联合决策。理论分析和实验结果均证明了 ConfSleepNet 在睡眠分期任务中的有效性。代码可在 ConfSleepNet 获取(https://github.com/By4te/ConfSleepNet_ICML2026/)。 睡眠分期,睡眠健康,深度学习,多视图学习,一致性感知融合。 ## 1 引言 睡眠约占人类一生中三分之一的时间,对维持身心健康至关重要(Lane et al., 2023)。不幸的是,越来越多的人遭受睡眠障碍的困扰,这构成了重大的公共卫生挑战(Perez-Pozuelo et al., 2020; Grandner, 2022)。例如,全球约 36% 的人口和 1.76 亿中国人经历睡眠障碍,导致心血管疾病、认知衰退和记忆力下降等健康问题。临床上,睡眠分期是评估人类睡眠的基础过程(Kong et al., 2023)。传统上,这项任务由睡眠专家基于整夜多导睡眠图(PSG)手动完成,通常需要数小时(Portier et al., 2000)。相比之下,机器辅助分类模型可以在几秒钟内完成。因此,自动化睡眠评分过程势在必行。 以往的自动睡眠分期研究根据网络输入类型可分为单视图方法(Supratak et al., 2017; Li et al., 2024; Phyo et al., 2023)和多视图方法(Phan et al., 2022; Chen et al., 2023; Pradeepkumar et al., 2024)。单视图方法通常使用脑电图(EEG)提供的单模态信息进行睡眠分期。相比之下,一些研究探索引入额外的模态,如眼电图(EOG),为分类模型提供互补的视图信息。值得注意的是,现有方法通常假设不同视图是良好对齐的,为不同视图分配相等的权重(例如,通过拼接)或为每个视图学习一个固定的权重(Phan et al., 2022; Pradeepkumar et al., 2024)。然而,这种假设在现实应用中并不总是成立,因为来自不同视图的信息可能存在冲突(例如,两个视图可能指向不同的睡眠阶段)。因此,一个精心设计的模型必须意识到这种冲突,并在决策过程中动态调整每个视图的重要性。 在这项工作中,我们提出了 ConfSleepNet,一种能够有效管理视图间冲突并促进可靠睡眠分期决策的一致性感知证据框架。具体来说,ConfSleepNet 包括两个主要阶段:多视图证据提取和一致性感知聚合。首先,使用特定于视图的证据深度神经网络(DNN)从多模态输入(包括 EEG、EOG 及其组合)中学习与类别相关的证据。值得注意的是,与现有方法不加区分地对所有模态使用五类分类设计不同,我们采用了结合粗粒度和细粒度类别的混合类别结构。这使得模型能够以合理且符合生理学的方式从每个视图中提取证据。在多视图聚合阶段,我们使用由学习到的证据参数化的狄利克雷分布构建包含类别信念质量和预测不确定性的视图特定意见。对于最终决策,我们提出了一种新颖的一致性感知多视图聚合方法,该方法明确考虑了视图间的冲突,从而将多个视图特定意见整合为可靠的联合意见。 我们的主要贡献总结如下:(1)我们提出了一个名为 ConfSleepNet 的证据框架,该框架引入了混合类别结构,实现了从 EEG 和 EOG 信号的差异化证据学习。(2)我们提出了一种一致性感知多视图聚合方法,通过明确考虑视图间冲突来增强分类结果的可靠性。第 3.5 节的理论分析表明,该方法可以将多个可能冲突的意见整合为合理的联合意见。(3)所提出的方法在多个公开数据集上进行了评估,结果表明其优于最先进的基线方法。 ## 利益冲突披露 作者声明与本工作无财务利益冲突。 ## 2 相关工作 ### 2.1 自动多视图睡眠分期 与单视图数据相比,利用多视图数据进行学习可以提供更丰富的信息,其在睡眠分期任务中的有效性已得到充分证明。现有方法通常从每个视图独立学习特征,然后进行特征级融合。例如,Chambon et al. (2018) 从 PSG 信号中学习高级表示,随后构建用于分类的联合表示。类似地,Phan et al. (2018) 将原始信号转换为时频图像,然后执行特征级融合进行预测。这些工作采用简单的操作(例如拼接)进行多视图融合,隐含地假设所有视图同等重要。然而,这种假设并不总是成立,引发了对模型可靠性的担忧。针对这个问题,Jia et al. (2021) 采用双流网络从 EEG 和 EOG 信号中独立提取特征,并利用注意力机制进行特征融合。此外,Dai et al. (2023) 采用 Transformer 编码器(Vaswani, 2017)进行视图特定的特征提取,并基于自注意力机制进行多视图特征融合。尽管这些方法能够适当地融合多个视图,但它们仍然无法检测每个视图内的潜在噪声,从而损害了最终预测的鲁棒性。 ### 2.2 冲突性多视图学习 早期的多视图学习工作依赖于贝叶斯方法(Neal, 2012; Gal and Ghahramani, 2016)来构建权重分布,但受到高昂计算成本的限制。随后,集成方法(Egele et al., 2022; Ganaie et al., 2022)通过组合多个独立子网络的预测推动了该领域的发展。尽管取得了进展,但这些方法忽视了视图间的冲突。近年来,证据深度学习(EDL)(Sensoy et al., 2018)在多视图学习任务中取得了显著成功(Li et al., 2023; Xia et al., 2024)。在 EDL 框架内,相关工作(Han et al., 2022; Shao et al., 2024; Huang et al., 2025)采用 Dempster-Shafer 理论(Dempster, 1968)为具有高不确定性的视图分配较低的权重,从而解决视图间的冲突。然而,现有的基于 EDL 的方法在处理冲突对预测不确定性的影响方面存在局限性:它们隐含地假设整合更多确定的意见总是会降低整体不确定性(Liu et al., 2022; Zhang et al., 2023; Xu et al., 2024)。我们认为这种假设不合理,因此提出了一种一致性感知的多视图聚合方法,并对其优势进行了理论分析。 参见图注图 1:ConfSleepNet 示意图。四个证据深度神经网络 {f_v(·)} 从不同视图中学习类别特定证据,这些证据涉及两种不同的类别结构。接下来,证据映射层将粗粒度证据映射为细粒度证据。之后,我们基于获得的证据构建视图特定意见 {M^v},然后将它们组合成联合意见 M。在多视图融合中,我们通过不确定性估计识别冲突意见,并相应地减少它们在决策中的影响。 ## 3 所提出的方法 提出的 ConfSleepNet 处理一系列 30 秒睡眠历元 x^(L) = {x_1, x_2, ..., x_L},并根据 AASM 规则(Berry et al., 2012)将每个历元 x_i 分类为睡眠阶段 y_i ∈ {W, N1, N2, N3, REM}。这里,x_i ∈ R^{2×T} 包含采样频率相同的 EEG 和 EOG 信号,T 是一个历元中的点数。ConfSleepNet 的整体架构如图 1 所示,后续小节将进行详细讨论。 ### 3.1 设计原则 EEG 和 EOG 是临床睡眠分期应用中使用最广泛的两种生理信号。对于这两种不同的模态,其信号特征既独特又在生理上互补。因此,它们对同一样本的预测可能一致也可能冲突。我们认为睡眠分期模型应具有良好的鲁棒性,即使在来自不同视图的预测存在冲突时也能做出可靠的最终决策。为实现这一目标,以下设计原则旨在将互补性(即 EEG 和 EOG 包含互补信息)和可靠性(即可靠的多视图聚合)结合到模型中。 **原则 1(互补性)**:EEG 和 EOG 的互补性有利于睡眠阶段分类。 根据 AASM 标准,PSG 信号通常被分割成 30 秒的历元,并分为五个睡眠阶段之一:清醒期(W)、快速眼动期(REM)和三个非快速眼动期(NREM)阶段(N1, N2 和 N3)。以往的工作通常对这两种模态(即 EEG 和 EOG)不加区分,直接对其进行五类分类。然而,在临床实践中,EEG 是睡眠分期的主要模态,为不同的睡眠状态提供判别性的神经生理模式。同时,EOG 作为基于 EEG 睡眠分期的重要辅助模态,在识别 REM 阶段方面起着关键作用。我们在附录 A.1 中详细描述了 EEG 和 EOG 的信号特征。基于不同模态的信号特征,ConfSleepNet 为 EOG 设计了粗粒度分类结构(即区分 W, REM 和 NREM),同时为 EEG 设计了细粒度分类结构(即将 NREM 进一步细分为 N1, N2 和 N3 三个子阶段)。通过这种设计,ConfSleepNet 能够充分利用 EEG 和 EOG 的互补特征,从而提升模型性能。 **原则 2(一致的多视图聚合)**:整合额外的一致视图意见会降低整体不确定性(即产生更确信的意见)。 如何合理整合多个视图仍是一个开放性问题。最近,Xu et al. (2024) 提出了 ECML,代表了当前最先进水平。该方法的核心思想是,将不确定的视图整合到原始视图中会增加整体不确定性。例如,考虑同一实例的两个视图,分别产生意见 M^1 和 M^2。两个意见产生相同的预测,但对其自身预测的不确定性程度不同(u^1=0.3 和 u^2=0.8)。当使用 ECML 聚合 M^1 和 M^2 时,得到的联合意见的不确定性为 0.436,高于 u^1。我们认为这不合理,因为 ECML 的聚合结果没有考虑意见之间的一致性。直觉上,整合额外的一致意见应该降低整体不确定性,从而使最终决策更确信。 **原则 3(冲突的多视图聚合)**:整合一个具有较高不确定性的冲突视图意见会增加整体不确定性(即产生较不确信的意见)。 在睡眠分期中,EEG 和 EOG 视图可能对同一样本产生不一致的意见,这通常源于信号特征差异、噪声干扰或生理变异性等因素。因此,提出的 ConfSleepNet 应该对冲突视图具有鲁棒性,这对临床采用至关重要。然而,大多数现有方法缺乏适当的机制来处理冲突视图,从而损害了模型性能。我们认为,整合一个具有高不确定性的冲突意见会削弱原始意见的可信度。因此,提出的多视图聚合方法应在合理纳入冲突对最终决策的影响的同时,明确评估视图间冲突的程度。 ### 3.2 视图特定证据

相似文章

按部就班:使用评分规则的自动睡眠分期分类

arXiv cs.AI

本文提出了一种确定性的、基于规则的睡眠分期方法,该方法明确实现了美国睡眠医学学会(AASM)的评分规则,并提供了逐时段的自然语言解释。在50份多导睡眠图记录中,该方法与多数投票共识达到了60.5%的逐时段一致性,为不透明的深度学习模型提供了透明性的补充。