在无原始ECG回放的持续ECG部署中分离专家保留与自主源推断
摘要
本文介绍了IRFE-ECG,一种用于持续ECG部署的方法,该方法利用ECGFounder的冻结特征将专家保留与自主源推断分离,在无需回放原始ECG的情况下实现了强劲性能。
arXiv:2607.01674v1 公告类型:新发布
摘要:在多源ECG部署中,当先前的原始ECG无法保留或回放时,模型可能需要纳入新的数据源。冻结预训练骨干网络并为每个源分配独立的分类器可以防止参数干扰,但当源元数据不可用时,部署仍然需要选择相应的专家。我们通过\ours{}(一个基于冻结的1024维ECGFounder特征构建的增量专家库)研究了这一区别。每个新到来的域都会添加一个平衡softmax线性专家,同时仅利用迄今为止观察到的源所保留的训练特征和域标签来拟合一个轻量级路由器。一个经过验证校准的边界规则融合两个最可能的专家,而不是仅仅依赖于单个路由专家。
在CPSC、PTB-XL、Georgia和Chapman-Shaoxing数据集上,源感知专家选择达到了$0.7915\pm0.0036$ Macro-F1,匹配的离线独立头参考文献达到了$0.7885\pm0.0009$,支持强大的源感知专家保留。在没有源ID的情况下,MLP路由器达到了$0.7756\pm0.0027$,top-2边界融合达到了$0.7782\pm0.0022$。相对于硬MLP路由,top-2的提升很小($+0.0026$),配对自助法的95%置信区间包含零。在三种域顺序下,top-2到全知专家的差距保持在$0.0111$--$0.0133$,表明自主源推断是当前主要瓶颈。没有回放原始ECG,但保留了冻结的训练特征用于路由器更新;因此该方法并非无内存。
查看缓存全文
缓存时间: 2026/07/03 05:45
# 在无原始心电回放的持续心电部署中分离专家保持与自主源推理
来源:https://arxiv.org/html/2607.01674
###### 摘要
在多源心电部署中,当早期原始心电无法保留或回放时,模型可能需要整合新的数据源。冻结预训练主干并为每个源分配一个独立的分类器可以防止参数干扰,但当源元数据不可用时,部署仍然需要选择一个专家。我们通过 IRFE-ECG 来研究这一区别,这是一个建立在冻结的 1024 维 ECGFounder 特征上的增量专家库。每个新到达的域添加一个平衡 softmax 线性专家,同时一个轻量级路由器仅根据已观测源的保留训练特征和域标签进行拟合。一个经过验证集校准的边际规则融合两个最可能的专家,而不是只采用单个路由专家。
在 CPSC、PTB-XL、Georgia 和 Chapman-Shaoxing 数据集上,源感知专家选择达到 0.7915±0.0036 的 Macro-F1,匹配的离线独立头参考达到 0.7885±0.0009,这支持了强大的源感知专家保持能力。在无源 ID 的情况下,MLP 路由器达到 0.7756±0.0027,top-2 边际融合达到 0.7782±0.0022。Top-2 相对于硬 MLP 路由的增益很小(+0.0026),来自配对 bootstrap 的 95% 置信区间包含零。在三个域顺序中,top-2 与 oracle 之间的差距保持在 0.0111–0.0133,这表明自主源推理是主要的剩余瓶颈。没有回放原始心电,但保留了冻结的训练特征用于路由器更新;因此该方法并非免存储。
## I. 引言
心电系统很少局限于一个固定的数据分布。持续心脏信号研究已经考虑了跨疾病、时间、模态和机构的变化 [6](https://arxiv.org/html/2607.01674#bib.bib20),而多中心心电持续学习工作则突显了顺序心电适应中的数据治理和数据共享约束 [4](https://arxiv.org/html/2607.01674#bib.bib18)。一个部署的心电系统可能首先接收来自一家医院或采集设备的数据,之后遇到在不同硬件、队列或注释协议下记录的记录。在每个新源上更新共享模型可能会覆盖先前的决策边界,而保留或集中管理原始历史心电可能受到数据治理和数据共享约束的限制。基础模型提供了一种有用的替代方案:固定的表示可以支持轻量级域特定分类器,而无需重复优化大型主干。
然而,仅参数隔离并不能解决部署问题。如果在推理时知道源元数据,那么选择对应的冻结专家是直接的,并且先前的专家不会被覆盖。如果源未知,系统必须推断哪个专家或专家组合应该处理每个心电。这一区别至关重要:源感知专家选择可以接近匹配的离线参考,而自主路由仍然可能留下可测量的测试时差距。将源感知结果视为完整的持续学习解决方案会掩盖源未知部署中的主要失败模式。
本文做出三点贡献。首先,我们将无原始心电回放的持续心电部署形式化为两个耦合但不同的问题:保留源特定专家和在元数据不可用时推断测试心电的源。我们通过 IRFE-ECG 实例化这一形式化,这是一个基于 ECGFounder 的冻结特征专家库,其中每个新到达的域添加一个隔离的平衡 softmax 线性专家,并且先前的专家从不更新。
其次,我们在严格的仅见过域协议下评估自主源推理。比较包括池化头预测、质心路由、kNN、收缩 LDA、线性路由器、MLP 路由器和概率平均控制。我们还测试了一个经过验证集校准的 top-2 边际融合规则作为实践性改进,而非核心主张。
第三,我们表明主要限制是自主源推理而非专家保留。源感知专家选择仍然接近匹配的离线独立头参考,而自主路由在三个域顺序和从 1% 到 100% 的特征存储预算中留下可复现的差距。这一发现阐明了在将隔离专家库视为完整的源未知部署解决方案之前,需要改进什么。
## II. 相关工作
### II-A. 心电基础模型
心电基础模型旨在为下游心电分析提供可迁移的表示。我们仅使用 ECGFounder 作为冻结的单导联特征提取器,并在整个持续学习过程中保持主干固定 [8](https://arxiv.org/html/2607.01674#bib.bib1)。这种设计将问题从表示学习转向部署:固定的心电特征是否能够支持不断扩展的源特定专家集,以及在源元数据不可用时能否自主选择这些专家。
### II-B. 持续学习与参数隔离
诸如弹性权重巩固 (EWC) [5](https://arxiv.org/html/2607.01674#bib.bib2) 和突触智能 (SI) [19](https://arxiv.org/html/2607.01674#bib.bib4) 等正则化方法限制了对被认为对先前任务重要的参数的更改。无遗忘学习 (LwF) 从先前模型中蒸馏预测 [9](https://arxiv.org/html/2607.01674#bib.bib3),而重演方法则保留一部分先前示例。iCaRL 结合了示例重演与最近均值分类器 [13](https://arxiv.org/html/2607.01674#bib.bib5)。这些方法主要解决共享参数中的干扰问题。而专家库则隔离参数,这减少了权重干扰,但将部署挑战转向任务或域推断。
### II-C. 心电特定的持续与跨域学习
持续学习也直接在心电和生理信号中进行了研究。CLOPS 使用基于重演的策略考虑了跨疾病、时间、模态和机构的心脏信号 [6](https://arxiv.org/html/2607.01674#bib.bib20)。多中心心电持续学习工作评估了在数据共享约束下跨公共心电源的顺序适应 [4](https://arxiv.org/html/2607.01674#bib.bib18),而 ECG-CL 则研究了用于全面心电解释的参数隔离机制 [2](https://arxiv.org/html/2607.01674#bib.bib19)。诸如 DREAM-CL 等原型重演方法进一步说明了存储设计在持续心电心律失常检测中的作用 [12](https://arxiv.org/html/2607.01674#bib.bib23)。更广泛的综述总结了跨心电及相关生理信号的重演、正则化和基于架构的策略 [7](https://arxiv.org/html/2607.01674#bib.bib21)。与此同时,跨数据集可迁移性分析(如 MELEP)强调心电表示和分类器在不同数据集和标签空间中的表现可能不同 [11](https://arxiv.org/html/2607.01674#bib.bib22)。这些研究推动了持续和跨域心电分析,但并未直接回答本文所研究的源未知部署问题。我们使用冻结的心电基础表示和隔离的源特定专家,以在源元数据不可用时分离专家保留与自主源推理。
### II-D. 提示、适配器与专家路由
参数高效的持续学习方法向预训练主干添加提示、适配器或专家。L2P 从学习的提示池中检索提示 [18](https://arxiv.org/html/2607.01674#bib.bib6),而 CODA-Prompt 学习基于分解注意力的提示用于无重演持续学习 [16](https://arxiv.org/html/2607.01674#bib.bib7)。Expert Gate 顺序添加任务专家,并使用学习到的门控模型将测试样本路由到相关专家 [1](https://arxiv.org/html/2607.01674#bib.bib10)。CLOM 进一步强调任务增量评估与类增量评估在测试时任务身份是否可用方面不同 [3](https://arxiv.org/html/2607.01674#bib.bib13)。
这些方法表明,在一般的持续学习设置中,测试时的任务身份不能被假设。我们的目标不是将专家路由作为一种通用机制来提出,而是在无原始心电回放的持续心电部署中实例化并评估这一区别。与视觉变换器提示池不同,我们的路由器接收一个冻结的 1024 维心电特征向量。因此,我们专注于轻量级路由组件,可以直接在这个特征空间中进行训练和验证,使用冻结的 ECGFounder 特征、隔离的源特定专家和一个自主源路由器。
### II-E. 不平衡的心电分类
正常/异常心电标签跨源不平衡,使得准确率和正类 F1 本身不够充分。平衡 Softmax 将类频率纳入 softmax 分母 [14](https://arxiv.org/html/2607.01674#bib.bib8),而 logit 调整则根据标签先验移动决策边界 [10](https://arxiv.org/html/2607.01674#bib.bib9)。我们使用平衡 Softmax 训练域专家,并仅使用验证数据为每个专家校准一个决策阈值。我们报告 Macro-F1 作为主要指标,并为自主 top-2 模型包括特定类别的 F1、平衡准确率、AUROC 和 AUPRC。

## III. 方法
### III-A. 问题设置
令 D1,...,DT 为一个心电域序列。域 Dt = { (xi, yi) } i=1^nt 包含单导联心电 xi 和二元正常/异常标签 yi ∈ {0,1}。在步骤 t,学习器接收 Dt 的训练集和验证集。来自 D1:t-1 的原始心电不被回放。为了路由器更新,我们保留来自先前训练样本的冻结特征向量和域身份。测试集在最终评估之前保持不可访问。因此,该协议是无原始心电回放的,但保留用于路由器更新的特征级存储。
我们区分两种推理设置。**源感知参考**提供源 ID d 并直接选择专家 gd。主要的**自主设置**不提供 d,并要求路由器选择或融合专家。这种分离很重要,因为隔离的专家参数在其域被学习后不会更新,而自主预测可能因路由错误而恶化。
对于共享参数基线,我们记录传统的结果矩阵 R ∈ R^{T×T},其中 Rt,j 是在训练到域 t 后在域 j 上的 Macro-F1,并计算
BWT = 1/(T-1) ∑_{j=1}^{T-1} (R_{T,j} - R_{j,j})。 (1)
然而,对于路由专家库,R 的变化可能反映路由器变化而非专家遗忘。因此,我们仅将路由 BWT 用作诊断,并将最终的自主 Macro-F1 和路由准确率作为主要衡量指标。
### III-B. 冻结基础专家
冻结的 ECGFounder 主干将一个心电映射到
h = f_θ(x), h ∈ ℝ^{1024}, (2)
其中 θ 从不更新。当域 t 到达时,添加一个线性专家 gt:
l_t = g_t(h) = W_t h + b_t, W_t ∈ ℝ^{2×1024}。 (3)
仅优化 gt;g1:t-1 保持冻结。专家使用平衡 Softmax,其类计数根据当前域的训练集估计。在模型选择之后,在该域的验证概率上校准一个域特定阈值 τt,然后固定用于测试评估。
这种架构刻意隔离了域的决策边界。其源感知性能是一个 oracle 参考,并非证明测试时域推断已解决。我们还与一个匹配的离线参考进行比较,该参考同时使用所有域的训练集并行训练相同的独立头。
### III-C. 增量域路由器
在步骤 t,路由器仅在已见域集 St = {1,...,t} 上训练。我们的判别式路由器是一个紧凑的 MLP,具有 1024 维输入、LayerNorm、128 单元隐藏层、GELU 激活、dropout 和一个线性输出层,其维度等于 |St|:
q_φt(h) = W_2 Dropout( GELU( W_1 LN(h) ) )。 (4)
它通过在存储的来自 St 的训练特征和域标签上的交叉熵进行优化。恢复在拼接的已见域验证特征上最大化路由准确率的检查点。在每次观察到新域后重新拟合路由器;它永远不会接收到未来域的特征或测试标签。稍后报告的特征存储预算计数用于路由器拟合的存储训练特征行数。验证特征用于实验协议中的模型选择,不计入路由器训练存储预算。
为了比较,我们评估一个余弦最近质心路由器、一个基于保留特征的余弦 kNN 路由器、一个共享协方差收缩 LDA 路由器以及一个线性域分类器。LDA 路由器仅使用已见域的训练特征估计一个域均值和一个带有收缩正则化的共享协方差矩阵。这些控制测试在冻结特征空间中是否需要单个质心、局部邻域、线性分离或非线性判别边界。
### III-D. Top-2 验证边界融合
硬路由器仅应用得分最高的专家。为了降低对硬 top-1 专家选择的敏感性,令 K(h) 包含具有最大路由器 logit sk(h) 的两个专家。它们的归一化权重为
α_k(h) = exp( sk(h) / Tr ) / ∑_{j∈K(h)} exp( sj(h) / Tr ), (5)
其中 Tr=1 在评估前固定。专家 k 产生正类概率 pk(h) 并有一个域特定验证阈值 τk。我们融合校准的边界而非原始概率:
m(h) = ∑_{k∈K(h)} α_k(h) ( pk(h) - τk ), ŷ = I[ m(h) ≥ 0 ]。 (6)
该规则仅用于自主推理,不使用源标签、测试标签或任何额外的验证器。它旨在减少当路由器将正确专家排名第二时的错误路由。Top-2 融合是使用验证阈值的纯粹路由后处理步骤,不涉及任何额外的训练或测试时域标签。相似文章
DeepArrhythmia: 通过选择性证据获取进行节段上下文感知的心电心律失常分类
DeepArrhythmia是一个多模态框架,用于心拍级别的心电(ECG)心律失常分类,它结合了原始心电信号和波形图像,利用节段级置信度选择性获取生理证据以提高准确性。
EEG基础模型中的身份陷阱:诊断性审计
本文识别并诊断了EEG基础模型中的“身份陷阱”,即高准确率可能源于受试者身份特征而非真实的临床生物标志物。它提出了FMScope,一种冻结表示协议以分离这些信号,并证明了受试者身份混杂在三模型中普遍存在且可通过线性方法移除。
RECTOR:面向情感和认知表征学习的掩码区域-通道-时间建模
RECTOR 是一个自监督框架,从 EEG/sEEG 信号中学习联合的区域-通道-时间表征,用于情感和认知状态分类,在情绪识别和任务参与度基准测试中取得了最先进的结果。
基于领域知识的时空图卷积网络用于心电图识别
本文提出了一种基于领域知识的时空图卷积网络用于心电图识别,该网络利用PRQST关键点和双流有向图来建模心电图周期内和周期间的依赖关系,在首届中国心电图智能竞赛数据集上取得了最先进的F1分数。
通过智能分区实现深度脑电去噪器的无监督训练
本文提出了一种名为智能分区自监督去噪(iPSD)的方法,该方法通过在不需干净参考数据的情况下对噪声片段进行分区,实现了深度脑电去噪器的无监督训练。