ECG与血管造影表征的跨模态对比学习用于重度狭窄分类

arXiv cs.LG 2026/06/03 04:00 论文

cross-modal contrastive-learning ecg angiography stenosis medical-ai deep-learning

摘要

本文介绍了StenCE，一个预训练框架，利用ECG与X射线血管造影表征之间的跨模态对比学习，从ECG中检测重度冠状动脉狭窄，实现了高性能，并能够在无症状患者中实现早期诊断。

arXiv:2606.02605v1 Announce Type: new 摘要：冠状动脉狭窄是一种常见的心血管疾病，未治疗的严重病例存在显著的心梗风险。尽管冠状动脉（X射线）血管造影仍是狭窄诊断的标准，但它们具有侵入性、耗时且资源密集，因此仅对有症状和既往临床检查提示高概率患病者进行。然而，部分患者，尤其是无症状者，可能未被诊断。从ECG中检测狭窄迹象——ECG快速、廉价、无创，因此即使在无症状患者中也常规采集——将有助于早期诊断。然而，由于ECG中尚未识别出可靠的狭窄特异性信号，目前无法用于狭窄风险分层。为解决此问题，我们引入了StenCE，一个预训练框架，允许基于直接从ECG导出的特征对患者进行分层。在不同狭窄严重程度阈值和额外ECG疾病分类任务上的评估表明，不同ECG编码器均实现一致的性能提升，超越了先前工作。所获模型成功检测到ECG中用于狭窄诊断的信号，并首次在重度狭窄分类中实现高性能。源代码可在 https://github.com/NikolaCenic/ecg-stenosis-cls 获取。

查看原文

查看缓存全文

缓存时间: 2026/06/03 09:38

# 心电图与血管造影表征的跨模态对比学习用于严重狭窄分类
来源：https://arxiv.org/html/2606.02605
11institutetext:1慕尼黑工业大学与TUM大学医院医疗保健与医学人工智能教席，德国慕尼黑
2帝国理工学院计算系，英国伦敦
3慕尼黑机器学习中心 (MCML)，德国慕尼黑
4TUM大学医院内科学系，德国慕尼黑
11email:nikola\.cenikj@tum\.deÖzgün Turgut1https://orcid.org/0009-0002-8704-0277Alexander Müller4Alexander Steger4Jan Kehrer4Marcus Brugger4Daniel Rueckert1,2,3https://orcid.org/0000-0002-5683-5889Eimo Martens4https://orcid.org/0000-0002-5801-0901and Philip Müller1https://orcid.org/0000-0001-8186-6479

###### 摘要

冠状动脉狭窄是一种常见的心血管疾病，未经治疗的严重病例会带来显著的心梗风险。虽然冠状动脉（X射线）血管造影仍是狭窄诊断的标准方法，但该方法具有侵入性、耗时且资源密集，因此仅适用于基于症状和既往临床测试具有高患病概率的患者。然而，部分患者（尤其无症状者）可能未被诊断。从心电图（ECG）中检测狭窄迹象——ECG快速、廉价、无创，因此在无症状患者中也常规采集——将有助于早期诊断。然而，由于ECG中尚未发现可靠的狭窄特异性信号，目前无法用于狭窄风险分层。为解决此问题，我们提出了*StenCE*，一种预训练框架，允许基于直接从ECG提取的特征对患者进行分层。在多个狭窄严重程度阈值以及额外ECG疾病分类任务上的评估表明，该框架在不同ECG编码器上均取得一致的性能提升，优于先前工作。所得模型成功检测到ECG中用于狭窄诊断的信号，并首次在严重狭窄分类中达到高性能。源代码可在https://github.com/NikolaCenic/ecg-stenosis-cls获取。

## 1 引言

冠状动脉狭窄是一种常见的心血管疾病，随时间推移逐渐加重。由于严重病例常导致心力衰竭，早期诊断对提高生存率至关重要。严重狭窄的诊断通常通过冠状动脉（X射线）血管造影进行，多个血管造影视图捕获冠状动脉的不同节段。然而，X射线血管造影是一种侵入性操作，存在较小的死亡风险，通常仅用于基于症状和临床测试具有高狭窄可能性的患者。因此，无症状患者可能在疾病进展时仍未确诊。从快速、无创且常规采集的ECG模态中识别狭窄指标，即使对无症状患者也能实现早期诊断。然而，尽管ECG用于诊断不同的心血管疾病，但其对冠状动脉狭窄提供的信息有限，因为严重狭窄患者常表现为正常ECG [1 (https://arxiv.org/html/2606.02605#bib.bib29)]。

在本工作中，我们旨在检测ECG中的狭窄信号，从而实现对狭窄风险的早期识别。为此，我们开发了一个基于深度学习的狭窄分类器，仅使用ECG输入。为了训练该模型，我们依赖于从X射线血管造影编码器中提取的信息。具体而言，如图1所示，我们在ECG编码器与训练用于狭窄分类的血管造影编码器之间采用多模态对比学习，随后对预训练的ECG模型进行微调。我们的贡献如下：

1. 1. 我们提出了*StenCE*，一个对比预训练框架，将ECG表征与来自多视图血管造影狭窄分类模型的特征对齐，从而使ECG编码器能够仅从ECG中检测狭窄信号。
2. 2. 我们在临床狭窄分类上的评估显示，对于最严重病例，AUC达到0.822，证明严重狭窄可以仅从ECG中识别，从而实现早期狭窄检测。
3. 3. 在多个狭窄严重程度以及EchoNext数据集的额外心脏异常任务上的评估进一步证明了我们预训练框架的实用性。

图1：所提出方法的概述：来自同一患者的视图血管造影和12导联ECG使用基于transformer的模态特定编码器进行编码。ECG编码器被预训练以提取与冻结的、训练用于冠状动脉狭窄分类的血管造影编码器对齐的特征。然后对预训练的ECG编码器进行微调，用于冠状动脉狭窄以及从ECG诊断的其他心脏异常。
## 2 结果

在表1中，我们报告了在完全微调和线性探测设置下，使用EchoingECG和OTIS作为ECG编码器骨干，并经过StenCE预训练（分别称为EchoingECG-StenCE和OTIS-StenCE）的结果。我们将它们与OTIS、EchoingECG以及其他ECG基线进行比较。

我们的模型能够仅从ECG中检测到严重狭窄的明确诊断信号。完全微调结果（表 2）显示，在最严重的狭窄阈值上表现强劲，在 \(=0\|=100=0\\;\|=100\) 设置下AUC达到0.822。我们的模型是首个在基于ECG的狭窄分类中达到如此高性能的模型，证实了其直接从ECG中提取强诊断信号的能力，从而支持早期严重狭窄检测。

StenCE预训练在大多数任务中为OTIS和EchoingECG均带来了性能提升。在完全微调设置下，OTIS-StenCE在严重度阈值 \(=0\|=100=0\\;\|=100\) 上显著优于OTIS（AUC提高4%），而在 \(=0\|≥90=0\\;\|\\geq 90\) 上差异不显著。对于EchoingECG，微调EchoingECG-StenCE在 \(=0\|=100=0\\;\|=100\) 阈值上带来了11%的AUC提升，在所有模型中取得最佳整体性能。然而，在 \(=0\|≥90=0\\;\|\\geq 90\) 阈值上，EchoingECG的AUC比EchoingECG-StenCE高出4%。在EchoNext任务上，由于EchoNext数据集的规模较大，所有模型取得了可比的微调结果。尽管如此，对于OTIS和EchoingECG，StenCE变体相比其基础版本仍保持优势。在线性探测设置中（表 3），StenCE预训练的优势更加明显，对于OTIS和EchoingECG，StenCE变体在每个任务上均显著优于基础模型。最大增益出现在EchoingECG-StenCE上，在 \(=0\|=100=0\\;\|=100\) 阈值上相比EchoingECG的AUC提高了17%。类似地，OTIS-StenCE在 \(=0\|=100=0\\;\|=100\) 和 \(=0\|≥90=0\\;\|\\geq 90\) 阈值上分别比OTIS提高了8%和12%的AUC。同样，在EchoNext上，线性探测中的StenCE模型以AUC分别超过OTIS 2%和EchoingECG 7%。

图2：在不同狭窄阈值上的微调性能比较。虽然，如预期，当试图识别较轻病例时检测性能下降，但我们的StenCE框架仍然能够将严重病例与健康（0%堵塞）和轻度（50%堵塞）病例区分开。轻度病例的检测性能下降。在图2中，我们比较了在不同狭窄严重度阈值上的微调性能。从最严重病例的AUC 0.822开始，性能下降到较轻阈值 \(=0\|≥90=0\\;\|\\geq 90\) 的0.704，并接近随机性能对于最难诊断的狭窄（严重度 \(<70\|≥70<70\\;\|\\geq 70\)）。该阈值下的性能表明该模型尚不适合临床使用。这一趋势与先前研究[2 (https://arxiv.org/html/2606.02605#bib.bib10)]和[3 (https://arxiv.org/html/2606.02605#bib.bib11)]的发现一致。虽然他们的模型和数据集未公开，无法直接比较，但我们的结果表明了持续改进。在[3 (https://arxiv.org/html/2606.02605#bib.bib11)]中，对于 \(<70\|≥70<70\\;\|\\geq 70\) 阈值报告了0.57的AUC，而我们的模型超过了5%以上。类似地，在[2 (https://arxiv.org/html/2606.02605#bib.bib10)]中，仅ECG模型在 \(≤50\|≥99\\leq 50\\;\|\\geq 99\) 阈值上取得了0.654的AUC，而我们的模型在相同阈值下使用我们的数据集达到了0.687。

在StenCE预训练中引入狭窄监督可提高性能。表1展示了一项消融研究，分析了架构选择和StenCE中狭窄监督的影响。我们使用OTIS和EchoingECG作为ECG编码器骨干，评估在 \(=0\|=100=0\\;\|=100\) 严重度阈值上的狭窄分类以及EchoNext上的性能。对于架构，我们考虑了一种设置：血管造影编码器被冻结，并且不使用CLS token，而是使用研究级表征。为了检查狭窄监督的效果，我们改变权重WSten（0、0.3和1）。总体而言，使用中等权重（WSten=0.3）的狭窄监督，同时使预训练主要由CLIP损失驱动，持续地提升性能。该配置在四项评估中有三项取得了最佳结果，在另一项（使用OTIS的狭窄分类）中仅以1%的差异排名第二。

表1：StenCE中架构设计和狭窄监督的消融研究。我们研究了使用冻结的血管造影编码器和无CLS token，以及不同WSten值。实验采用基于OTIS和EchoingECG的ECG编码器进行线性探测。我们报告严重狭窄和EchoNext任务的AUC。每个类别中表现最佳的模型以**粗体**标出。结果表明，使用解冻的血管造影编码器、CLS token以及中等狭窄监督（WSten= 0.3）可获得最佳性能。
| OTIS | EchoingECG |
|------|------------|
| 消融 | =0\|=100 | EchoNext | =0\|=100 | EchoNext |
| 冻结血管造影编码器 & 无CLS token | 0.686 | 0.691 | 0.766 | 0.727 |
| WSten = 0 | 0.665 | 0.692 | 0.725 | 0.736 |
| WSten = 0.3 | 0.676 | 0.695 | 0.816 | 0.739 |
| WSten = 1 | 0.659 | 0.686 | 0.706 | 0.738 |
## 3 讨论与结论

局限性。本研究有三个主要局限性。首先，我们数据集中的每位患者因狭窄症状接受了X射线血管造影。虽然这是一种应控制的偏倚，但此类临床研究可能需要对健康患者进行X射线血管造影，使其暴露于严重风险。其次，我们的模型仅依赖ECG信号，与先前使用临床风险因素的工作[2 (https://arxiv.org/html/2606.02605#bib.bib10)]不同，我们并未整合互补数据源。纳入此类数据可能进一步提升性能。

结论。当前的狭窄分类模型依赖于在ECG特定任务上预训练的骨干网络，限制了其捕获狭窄特定信息的能力。我们通过引入基于配对ECG-血管造影数据的跨模型预训练克服了这一点，使ECG编码器能够编码血管造影中可见的狭窄相关特征。虽然所获得的性能仍不足以用于临床实践，但我们的结果证明了跨模态预训练的好处，并为未来向冠状动脉狭窄初步评估的方向发展、支持早期诊断奠定了基础。

### 3.0.1 致谢。

本研究获得了慕尼黑工业大学Klinikum Rechts der Isar伦理委员会批准（参考号2025-395-S-CB，申请日期2025年7月13日）。

## 参考文献

- \[1\] M. H. Crawford, C. A. Mendoza, R. A. O’Rourke, D. H. White, C. A. Boucher, and J. Gorwit (1978) Limitations of continuous ambulatory electrocardiogram monitoring for detecting coronary artery disease. Annals of Internal Medicine 89(1), pp. 1–5. Note: PMID: 666154 External Links: Document (https://dx.doi.org/10.7326/0003-4819-89-1-1), https://doi.org/10.7326/0003-4819-89-1-1 被引于：§1 (https://arxiv.org/html/2606.02605#S1.p1.1).
- \[2\] Z. Xue, S. Geng, S. Guo, G. Mu, B. Yu, P. Wang, S. Hu, D. Zhang, W. Xu, Y. Liu, L. Yang, H. Tao, S. Hong, and K. Chen (2024-11) Screening for severe coronary stenosis in patients with apparently normal electrocardiograms based on deep learning. BMC Medical Informatics and Decision Making 24, pp. . External Links: Document (https://dx.doi.org/10.1186/s12911-024-02764-0) 被引于：§2 (https://arxiv.org/html/2606.02605#S2.p4.4), §3 (https://arxiv.org/html/2606.02605#S3.p1.1).
- \[3\] C. Yeh, T. Tsai, C. Chen, Y. Chou, C. Mao, T. Su, N. Yang, C. Lai, C. Chen, H. Sytwu, and T. Tsai (2025) Artificial intelligence-enhanced electrocardiography improves the detection of coronary artery disease. Computational and Structural Biotechnology Journal 27, pp. 278–286. External Links: ISSN 2001-0370, Document (https://dx.doi.org/10.1016/j.csbj.2024.12.032) 被引于：§2 (https://arxiv.org/html/2606.02605#S2.p4.4).

ECG与血管造影表征的跨模态对比学习用于重度狭窄分类

相似文章

MSAIC-Net: 多尺度注意力与不平衡感知对比网络用于基于心电图的心肌基质异常检测

基于知识引导的跨模态融合与标签条件对比对齐实现成人到儿科心电图迁移

基于CT钙化积分扫描中机会性冠状动脉钙化和心外膜脂肪评估的机器学习预测阻塞性冠状动脉疾病

使用非对比CT钙化评分进行冠状动脉钙化定量分析以预测心肌缺血

基于机器学习的心脏科接口术语策展用于电子健康记录突出显示

提交意见反馈