QDSP：一种用于预测极低出生体重婴儿死亡或脑瘫的可解释结构化学习框架

arXiv cs.LG 2026/06/09 04:00 论文

摘要

QDSP 是一种可解释的结构化学习框架，用于预测极低出生体重婴儿的死亡或脑瘫，集成了配额引导子空间采样和可微决策引导结构感知。在一个真实队列和外部数据集上，它优于 XGBoost、TabNet 和 TabPFN 等基线模型，并识别了临床相关的预测因素，如 cPVL 和出生体重。

arXiv:2606.07606v1 公告类型：新摘要：极低出生体重婴儿（VLBWI）面临高死亡率和严重神经发育障碍（包括脑瘫）的风险，但在高维且数据有限的临床环境中，出院时的可靠预后分层仍然具有挑战性。针对这一问题，我们提出了 QDSP，一种可解释的结构化学习框架，集成了配额引导子空间采样（QSS）和可微决策引导结构感知（DSP）。QSS 模块通过基于自助法的特征一致性估计构建稳定性感知、低冗余的特征子空间，而 DSP 模块采用可微分的软斜决策结构来建模非线性临床交互，同时保留可追溯的决策证据。该框架在一个包含 51 名婴儿的真实 VLBWI 队列中进行了评估，并在三个公开的医学表格数据集上进行了进一步验证。在主队列上，QDSP 达到了 0.9200 的准确率和 0.9714 的 AUC，优于代表性机器学习和深度表格学习基线，包括 XGBoost、TabNet 和 TabPFN。在外部数据集上，QDSP 在不同样本量和临床分布下保持了具有竞争力的区分度和校准度。此外，基于 SHAP 的分析和可微决策路径追踪识别了临床相关的预测因素，包括囊性脑室周围白质软化（cPVL）和出生体重，这与已有的新生儿病理生理学证据一致。这些结果表明，QDSP 为 VLBWI 的出院时风险分层提供了一个可解释且稳健的框架，并可能支持新生儿重症监护环境中的早期个体化临床决策。

查看原文

查看缓存全文

缓存时间: 2026/06/09 08:50

# QDSP：一种用于预测极低出生体重儿死亡或脑瘫的可解释结构化学习框架
来源：https://arxiv.org/html/2606.07606
凌王 四川师范大学计算机科学学院 中国四川成都 lingwang@sicnu\.edu\.cn &李小龙 四川师范大学计算机科学学院 中国四川成都 20231393034@stu\.sicnu\.edu\.cn &周慧 四川大学华西第二医院 中国四川成都 1103570489@qq\.com &石晶 四川大学华西第二医院 中国四川成都 shijing@scu\.edu\.cn &张福浩 四川师范大学计算机科学学院 中国四川成都 fuahozhang@stu\.sicnu\.edu\.cn &陈大鹏∗ 四川大学华西第二医院 中国四川成都 cdp415@163\.com &母楠∗ 四川师范大学计算机科学学院 中国四川成都 nanmu@sicnu\.edu\.cn

###### 摘要

极低出生体重儿 \(VLBWI\) 死亡和严重神经发育障碍（包括脑瘫）的风险极高，然而在高维且数据有限的临床环境中，可靠的出院时预后分层仍然具有挑战性。为解决此问题，我们提出了 QDSP，一个可解释的结构化学习框架，该框架集成了配额引导子空间采样 \(QSS\) 和可微决策引导结构感知 \(DSP\)。QSS 模块通过基于自助法的特征一致性估计构建稳定性感知且低冗余的特征子空间，而 DSP 模块则采用可微分的软斜决策结构来建模非线性临床交互，同时保留可追溯的决策证据。该框架在一个包含 51 名婴儿的真实 VLBWI 队列上进行了评估，并在三个公开的医学表格数据集上进行了进一步验证。在原始队列上，QDSP 达到了 0.9200 的准确率和 0.9714 的 AUC，优于代表性的机器学习和深度表格学习基线方法，包括 XGBoost、TabNet 和 TabPFN。在外部数据集上，QDSP 在不同样本量和临床分布下保持了具有竞争力的判别能力和校准性能。此外，基于 SHAP 的分析和可微决策路径追踪识别出了临床相关的预测因子，包括囊性脑室周围白质软化 \(cPVL\) 和出生体重，这与已建立的新生儿病理生理学证据一致。这些结果表明，QDSP 为 VLBWI 的出院时风险分层提供了一个可解释且稳健的框架，并可能支持新生儿重症监护环境中的早期个体化临床决策。

*关*键词极低出生体重婴儿⋅\\cdot脑瘫⋅\\cdot可解释机器学习⋅\\cdot可微决策树⋅\\cdot临床风险分层⋅\\cdot小样本学习

## 1 引言

极低出生体重儿 \(VLBWI\) 由于生理发育不成熟和免疫功能脆弱，死亡和长期神经发育障碍的风险很高\[1 (https://arxiv.org/html/2606.07606#bib.bib1)\]。因此，出院时的早期预后分层对于旨在改善长期临床结局的及时干预和个体化随访管理至关重要\[2 (https://arxiv.org/html/2606.07606#bib.bib2)\]。近期的系统性证据进一步表明，临床上可部署的、用于 VLBWI 长期神经发育预后的出院时预测工具仍然有限\[3 (https://arxiv.org/html/2606.07606#bib.bib3)\]。在实践中，那些在随访中随后死亡的新生儿最初可能表现出与存活但后来发展为严重神经系统后遗症（如脑瘫）的婴儿相似的出院特征。这种显著的临床重叠使得早期风险区分变得复杂，并限制了传统基于评分的预后方法的有效性。

机器学习在新生儿结局预测方面显示出越来越大的潜力；然而，在该领域仍有几个方法论挑战尚未解决\[4 (https://arxiv.org/html/2606.07606#bib.bib4)\]。先前的研究表明，新生儿队列中的预测性能对数据质量、队列异质性和有限的样本量高度敏感\[5 (https://arxiv.org/html/2606.07606#bib.bib5)\]。在高维临床表格设置中，不稳定的特征选择和虚假相关性可能会严重损害泛化能力\[6 (https://arxiv.org/html/2606.07606#bib.bib6)\]。与此同时，高度复杂的深度学习架构常常牺牲可解释性，从而限制了它们在安全关键型临床决策场景中的适用性\[7 (https://arxiv.org/html/2606.07606#bib.bib7)\]。这些局限性凸显了对能够同时支持稳健预测、稳定表示学习和透明临床解释的建模框架的需求。

为了应对这些挑战，我们提出了配额可微结构感知 \(QDSP\) 框架，该框架将配额引导子空间采样 \(QSS\) 与可微决策引导结构感知 \(DSP\) 相结合。提出该框架的动机源于最近的证据，该证据表明有效的归纳偏置和结构化表示学习对于表格数据上的深度学习尤其重要，特别是在小样本条件下\[7 (https://arxiv.org/html/2606.07606#bib.bib7)\]。具体来说，QSS 执行稳定性感知的特征子空间构建以减少冗余并提高表示鲁棒性，而 DSP 采用可微分的软斜决策结构来捕获非线性临床交互，同时在端到端优化下保留显式的决策路径证据。

本研究的主要贡献总结如下：

1. 1.我们提出了 QDSP，一个用于高维小样本临床表格预测的可解释结构化学习框架，该框架同时考虑了预测判别能力、表示稳定性和临床可解释性。
2. 2.我们开发了两个互补模块：用于稳定性感知低冗余特征子空间构建的 QSS 和具有显式决策路径追踪能力的可微结构化决策建模模块 DSP。
3. 3.我们在一个真实的 VLBWI 队列和多个公开的医学表格数据集上评估了 QDSP，证明了其与代表性的机器学习和深度表格学习基线方法相比具有竞争力的预测性能、在有限数据设置下的鲁棒性以及临床一致的的可解释性。

## 2 相关工作

关于 VLBWI 预后预测的现有研究大致可分为三类：临床评分系统、传统机器学习方法和深度学习方法。这些研究逐步改进了新生儿结局预测；然而，在小样本临床环境中，在鲁棒性、可扩展性和可解释性方面仍存在重要局限性。

### 2.1 临床评分系统

早期的预后研究主要依赖手工制作的临床评分系统进行死亡率和神经发育风险评估。Gera 和 Ramji 确定胎龄、出生体重和机械通气是极低出生体重新生儿早期死亡率的重要预测因子\[8 (https://arxiv.org/html/2606.07606#bib.bib8)\]。Bührer 等人进一步比较了 CRIB、CRIB-II、胎龄和出生体重在 VLBWI 人群中评估死亡风险的效果\[9 (https://arxiv.org/html/2606.07606#bib.bib9)\]。最近，一项关于早产儿神经发育预测的系统评价强调了临床上对可靠出院时预后分层策略的持续需求\[3 (https://arxiv.org/html/2606.07606#bib.bib3)\]。

尽管这些评分系统提供了临床可解释的风险评估，但大多数仍然基于预定义的线性公式和有限的变量交互。因此，它们在表征 NICU 人群中异质性临床轨迹和复杂非线性关系方面的能力仍然受限。

### 2.2 传统机器学习

传统机器学习方法因其更强的非线性建模能力而越来越多地被应用于新生儿结局预测。Han 等人利用机器学习技术预测 VLBWI 的出生后生长衰竭，并证明了数据驱动预测在新生儿护理中的潜在效用\[5 (https://arxiv.org/html/2606.07606#bib.bib5)\]。Shu 等人提出了一个用于早产 VLBWI 新生儿死亡率和主要并发症的早期预测框架\[10 (https://arxiv.org/html/2606.07606#bib.bib10)\]，而 Lee 等人采用基于随机森林的模型进行早产儿死亡风险预测\[11 (https://arxiv.org/html/2606.07606#bib.bib11)\]。Bowe 等人进一步研究了用于预测极早产儿两年认知结局的机器学习方法\[12 (https://arxiv.org/html/2606.07606#bib.bib12)\]。

尽管提高了预测判别能力，但这些方法在高维且样本有限的临床数据集中通常表现出鲁棒性下降。特别是，不稳定的特征选择和对抽样变异的敏感性可能对泛化性能和模型可靠性产生不利影响。

### 2.3 深度学习

深度学习的最新进展进一步改善了新生儿预后的表示学习能力。He 等人提出了一个用于极早产儿早期神经发育预测的多任务多阶段迁移学习框架\[13 (https://arxiv.org/html/2606.07606#bib.bib13)\]。Ihlen 等人将机器学习应用于婴儿自发运动分析，用于多站点队列中的早期脑瘫预测\[14 (https://arxiv.org/html/2606.07606#bib.bib14)\]，而 Groos 等人开发了一个从婴儿自发运动估计脑瘫风险的深度学习框架\[15 (https://arxiv.org/html/2606.07606#bib.bib15)\]。这些研究表明深度架构有能力从生物医学数据中捕获复杂的发展模式。

然而，现有的深度学习方法大多侧重于非结构化模态，如影像或运动信号，并且对于异质性的出院时临床表格数据提供的透明度有限。此外，最近关于表格深度学习的研究表明，有效的归纳偏置和结构化表示学习对于在小样本条件下提高稳定性和泛化能力至关重要\[7 (https://arxiv.org/html/2606.07606#bib.bib7)\]。这些观察结果促使我们将结构化决策先验纳入我们提出的 DSP 模块。

总体而言，现有研究表明从传统评分系统到机器学习和深度学习方法取得了实质性进展。然而，对于高维小样本新生儿临床预测任务，同时实现稳健预测、稳定表示学习和临床可解释的决策证据仍然是一个重大挑战。

## 3 方法

### 3.1 整体结构

参见标题图 1：所提出的 QDSP 框架在嵌套验证协议下的整体架构。图1 (https://arxiv.org/html/2606.07606#S3.F1) 展示了所提出的 QDSP 框架的整体架构和训练流程。为了在有限样本条件下获得可靠的性能估计，该框架采用了嵌套交叉验证策略。具体而言，外循环采用分层五折交叉验证用于泛化评估，而内循环则执行留一法交叉验证 \(LOOCV\) 用于模型训练和超参数优化。这种嵌套设计最大限度地减少了信息泄露，同时最大化了稀缺临床样本的利用率。

对于每次训练迭代，原始特征空间首先由配额引导子空间采样 \(QSS\) 模块处理，以构建多个稳定性感知且低冗余的特征子空间。每个子空间随后被送入一个独立的可微决策引导结构感知 \(DSP\) 子模型，该子模型输出相应的预测概率。最终预测通过所有 DSP 子模型的集成聚合获得，产生用于区分两个互斥不良结局（脑瘫和死亡率）的估计风险概率。

### 3.2 配额引导子空间采样 \(QSS\) 模块

QSS 模块旨在提高高维小样本临床条件下特征的鲁棒性和子空间的多样性。该模块包括两个阶段：稳定性感知特征选择和加权特征子空间构建。

#### 3.2.1 稳健特征选择与冗余过滤

预处理流程首先采用中位数填补缺失值、连续变量的 Z 分数归一化以及移除近零方差特征，以减少噪声并提高建模稳定性。在每个训练折内，使用自助重采样评估采样扰动下的特征稳定性，迭代次数为 B=120，采样比例为 α=0.7。

遵循 Alelyani\[16 (https://arxiv.org/html/2606.07606#bib.bib16)\] 提出的稳定特征选择策略，利用重复的自助采样和特征排序来提高特征重要性估计的鲁棒性。对于每个自助子集 Db，计算所有候选特征的 ANOVA F 统计量，并保留前 k 个特征。令 cj 表示特征 j 在所有自助迭代中被选择的次数。特征 j 的稳定频率定义为：

freqj = cj/B， j=1,...,p。(1)
由此得到的稳定性频率反映了特征在小样本扰动下相关性的稳定性。随后根据 freqj 对特征进行排序，并保留前 K=2.5k 个特征，形成初始候选集 C。

为进一步减少冗余，在 C 内计算成对相关矩阵 R。对于任意满足 Rij > τ=0.9 的特征对，仅保留稳定性频率较高的特征。该过程产生一个精炼的低冗余特征池 C*，用于后续的子空间构建。

#### 3.2.2 加权子空间采样与集成配置

为生成多样且稳定的特征表示，在精炼的特征池 C* 上进行无放回加权抽样。特征 j 的抽样概率根据其稳定性频率定义：

πj = freqj / ∑j∈C* freqj。(2)
基于采样得到的特征，进一步定义一个稳定性感知的子空间得分：

score(Sm) = (1/|Sm|) ∑j∈Sm freqj。(3)
使用此策略，生成 M=4 个特征子空间 Sm ⊂ C*，其中每个子空间包含 k 个特征，并受到全局特征使用约束，旨在保持子空间间的多样性。每个子空间对应一个独立的基学习器 hm，该学习器为输入样本 x 输出预测概率 pm(x)。

原则上，最终的集成预测可以表述为：

p(x) = ∑m=1^M αm pm(x)， s.t. ∑m=1^M αm = 1， αm ≥ 0，(4)

相似文章

面向低维结构学习的鲁棒子空间约束二次模型

arXiv cs.LG

本文提出了一种鲁棒的子空间约束二次模型，用于从高维数据中学习低维结构，能够适应重尾噪声。我们开发了一种带有回溯线搜索的梯度算法，实验表明该方法在鲁棒性和重建精度上均有所提升。

极端降水降尺度的多分位数回归

arXiv cs.LG

介绍了Q-SRDRN，一种使用分位数损失的多分位数超分辨率网络，用于改进极端降水降尺度，在保持整体精度的同时，显著提高了强降雨事件的检测率。

将数据驱动预测与分配对齐：一种以决策为中心的生存分析方法

arXiv cs.LG

本文介绍了一种面向决策的生存分析学习方法，该方法通过NDCG优化将预测模型与后续分配决策对齐。应用于美国心脏移植数据后，排名性能提升了50-100%，每年可能带来数千额外生命年。

QSplitFL: Capability Aware Deep Q-Learning for Optimal Split Point Selection in Split Federated Learning

arXiv cs.LG

QSplitFL proposes a DQN-based framework for optimal split point selection in split federated learning, using client hardware metrics to adapt to heterogeneous devices. Experiments show improved convergence and accuracy across multiple datasets and architectures.

@MaximeRivest: https://x.com/MaximeRivest/status/2055293570119065875

X AI KOLs Following

MaximeRivest解释了DSPy的五个核心组件——Optimizers、Signatures、LMs、Modules和Adapters——并认为有效的AI工程需要掌握这些要素，同时强调了结构化输出渲染这一常常被忽视的作用。

相似文章

面向低维结构学习的鲁棒子空间约束二次模型

极端降水降尺度的多分位数回归

将数据驱动预测与分配对齐：一种以决策为中心的生存分析方法

QSplitFL: Capability Aware Deep Q-Learning for Optimal Split Point Selection in Split Federated Learning

@MaximeRivest: https://x.com/MaximeRivest/status/2055293570119065875

提交意见反馈