基于注意力的剂量变化下个体治疗获益概率估计
摘要
本文提出Dose-AIPTB,一种使用基于注意力的聚合估计离散剂量分配下个体治疗获益概率的框架,在数值实验中优于核替代方法。
arXiv:2606.13821v1 Announce Type: new
摘要:估计治疗对个体患者优于对照的概率,称为个体治疗获益概率(IPTB),为群体平均指标提供了一种临床直观的替代方案。然而,尽管临床实践中剂量变化干预很普遍,现有的IPTB估计方法大多局限于二元治疗设置。我们提出一个通用框架,用于在离散剂量分配下对有序结果进行IPTB估计,称为Dose-AIPTB(基于注意力的剂量IPTB)。我们的方法将问题重新定义为对未观察到的个体治疗效应符号的二元分类,通过协变量相似的成对比较构建伪标签,并通过注意力机制或Nadaraya-Watson核回归进行聚合。该公式自然地容纳多个离散剂量水平,超越了二元治疗范式。通过在协变量偏移、不同样本量和异质性结果下的真实世界和合成数据上的数值实验,我们证明基于注意力的聚合始终优于核替代方法。该框架为基于个体水平获益概率的个性化剂量选择提供了基础。实现该模型的代码可在 https://github.com/NTAILab/AIPTBDose 公开获取。
查看缓存全文
缓存时间: 2026/06/15 09:08
# 基于注意力机制的剂量变化下个体治疗效果获益概率估计
来源: https://arxiv.org/html/2606.13821
###### 摘要
对于个体患者,估计某种治疗相比对照更优的概率,即个体治疗获益概率 \(IPTB\),提供了一种在临床意义上直观的替代群体平均指标的方案。然而,现有的 IPTB 估计方法大多局限于二元治疗场景,尽管临床实践中普遍存在剂量变化的干预措施。我们提出了一个在离散剂量分配下针对有序结局进行 IPTB 估计的通用框架,称为 Dose-AIPTB(基于注意力的剂量 IPTB)。我们的方法将问题重新定义为对个体治疗效果未观测符号的二元分类,通过协变量相似配对比构建伪标签,并利用注意力机制或 Nadaraya-Watson 核回归进行聚合。这种公式自然地适应多种离散剂量水平,超越了二元治疗范式。通过在协变量偏移、不同样本量和异质性结局下的真实世界和合成数据上的数值实验,我们证明了基于注意力的聚合一致优于核方法。该框架为基于个体获益概率的个性化剂量选择奠定了基础。实现该模型的代码公开于 https://github.com/NTAILab/AIPTBDose。
## 1 引言
长期以来,临床决策一直受到群体层面证据的指导。平均治疗效果 (ATE) 作为该范式的基石,提供了一个单一指标来确定某种疗法是否对典型患者优于对照。该指标在获得监管批准和制定临床指南方面不可或缺。然而,当 ATE 从研究环境推广到临床床旁时,就会出现一个基本矛盾。ATE 解决了关于群体层面优越性的不确定性,而临床医生面临一个不同的问题:*这个具有特定特征组合的具体患者会得到益处吗?* 临床均势原则论证了试验层面的随机化,但对个体案例几乎没有指导意义。
这种脱节促使了向个体化的转变。条件平均治疗效果 (CATE) 作为一种自然扩展出现,旨在描述治疗效果如何根据患者协变量定义的亚组而变化。然而,即使是估计*预期*结果差异的 CATE,也无法满足临床医生的核心关切。实践中重要的不仅仅是获益的预期幅度,而是患者相对于替代方案经历有利结果的概率。这激发了*个体治疗获益概率* (IPTB),对于协变量为 \(X=x\) 的患者定义为
\[
\rho(\mathbf{x}) = \Pr\{H > Y \mid X=\mathbf{x}\} = \Pr\{\Delta > 0 \mid X=\mathbf{x}\},
\tag{1}
\]
其中 \(H\) 和 \(Y\) 分别表示治疗和对照下的潜在结果,\(\Delta = H - Y\) 捕捉个体层面的治疗效果。与通过一阶矩总结 \(\Delta\) 分布的 CATE 不同,IPTB 直接以临床推理中治疗获益概念相一致的方式,将阳性结果的概率作为目标。
IPTB 的吸引力掩盖了其统计复杂性。估计平均效应(无论是无条件 (ATE) 还是有条件 (CATE))只需要对观测结果的条件期望进行建模。相比之下,估计 \(\Pr\{\Delta > 0 \mid X=\mathbf{x}\}\) 需要恢复潜在结果的完整条件分布,或者至少是给定协变量下 \((H, Y)\) 的联合分布。这项任务因因果推断的核心障碍而变得根本上复杂:对于任何给定的个体,最多只能观测到一个潜在结果。反事实结果仍然隐藏,使得 \(\Delta\) 的符号在个体层面上本质上不可观测。
因此,重建 \(\Delta\) 的分布需要要么对底层数据生成过程进行参数假设,要么采用能够填补缺失反事实分布的复杂非参数策略。贝叶斯方法通过建模潜在结果的联合分布自然适应了这一挑战[31],而频率学派方法则越来越多地转向诸如概率分类或直接建模获益函数等技术[14, 13]。这些努力的一个共同点是认识到推断个体获益概率在假设和计算复杂性方面都比传统的效应估计提出了更高的要求。
关于异质性治疗效果估计的文献经历了显著的方法论演变。早期方法依赖带有交互项的正则化回归[8]。随后的进展引入了元学习器,包括 T-学习器、S-学习器、X-学习器和 DR-学习器[9],它们以灵活的方式组合基础估计器来估计 CATE[11, 21, 27]。此后,深度学习架构被用于捕捉协变量空间中复杂的、高维的关系[3, 16, 20, 24]。非参数核方法[7, 18]和基于 Transformer 的注意力机制[4, 14, 30]代表了更前沿的领域,提供了灵活的函数逼近,并在可解释性和可扩展性之间有不同的权衡。
并行的发展也特别针对 IPTB 估计。这些包括建模潜在结果联合分布的贝叶斯框架[31],以及将问题重新定义为概率分类的方法,其中目标是治疗结果超过对照结果的概率[14, 13]。尽管取得了这些进展,但这些文献中普遍存在一个共同的局限:对二元治疗分配的隐含假设。
在许多临床情境中,治疗不仅仅是存在或不存在;它以不同的强度、频率或数量给予。无论是将其概念化为药物单位数量、治疗持续时间还是活性成分浓度,*剂量*都引入了一层二元配方无法容纳的复杂性。患者可能从低剂量中获益,在高剂量下经历毒性,或表现出违背简单剂量反应假设的非单调反应。此外,定义为足以实现阳性治疗效果的最小水平的最佳剂量可能因个体而异,反映了潜在的生物学异质性。
这一差距并未被忽视。最近的工作已开始探索具有复杂治疗的因果推断,包括连续和多值干预[6, 17, 19, 22, 28]。从因果识别角度已审视了多版本治疗的问题[1, 25]。值得注意的是,已经提出了基于神经网络的方法来估计跨连续剂量参数的个体剂量反应曲线[23]。然而,这些方法通常针对预期结果或剂量反应曲面,而非获益概率——一个可能更好地捕捉临床上有意义的疗效阈值的量。
在这项工作中,我们提出了一个通用框架,用于在治疗以离散剂量水平给药且结局为连续或有序时估计 IPTB。它被称为 Dose-AIPTB(基于注意力的剂量 IPTB)。我们的方法将估计问题重新定义为二元分类,其中目标标签是个体治疗效果 \(\Delta\) 的符号。由于 \(\Delta\) 不可观测,我们从具有相似协变量特征的治疗患者和对照患者之间的配对比构建伪标签。这些比较使用依赖于特征的加权机制进行聚合,该机制尊重协变量相似性:我们实现了两种互补策略,分别基于 Nadaraya-Watson 核回归[15, 29]和点积注意力[12, 26]。由此产生的框架继承了分布因果推断[10]最新进展的理论基础。
我们专注于离散剂量设置,例如共同给药的药物数量等场景,解决了一个在实际中相关但方法学上探索不足的领域。对于给定的患者,低剂量可能带来益处,而高剂量可能有害,且最佳剂量可能取决于患者特定的特征。通过直接建模治疗获益超过临床有意义阈值(此处定义为优于对照)的概率,我们的方法为基于概率获益估计的剂量个性化奠定了基础。
本工作的贡献有三个方面:
1. 我们提出了一个非参数的 IPTB 估计模型,避免了参数分布假设。基于注意力的聚合机制能够从相似历史案例中灵活地借用信息。该模型背后的主要思想是考虑所有实例对,使得一对中的一个实例来自对照组,另一个来自治疗组。考虑配对显著增加了训练样本,并使我们能够在真实数据上验证模型。
2. 我们的框架明确适应不同的治疗剂量,超越了主导现有 IPTB 文献的二元治疗范式。
3. 我们通过在真实世界和合成数据集上的全面数值实验评估所提出的方法,检验了在协变量偏移、不同样本量和异质性结局结构下的性能。将所提模型与著名的元学习器进行比较:T-学习器、S-学习器、X-学习器和 DR-学习器。所有元学习器均选择随机森林[2]作为基础学习器。所有代码公开于 https://github.com/NTAILab/AIPTBDose。
## 2 问题表述
本研究考虑一项由两个不同队列组成的观察性研究:一个对照组和一个治疗组。对照组由数据集 \(\mathcal{D}_0 = \{(\mathbf{x}_i, y_i)\}_{i=1}^c\) 表示,包含 \(c\) 个独立观测。对于每个受试者 \(i\),\(\mathbf{x}_i \in \mathbb{R}^d\) 表示一个 \(d\) 维协变量向量,\(y_i \in \mathbb{R}\) 表示在对照条件下(例如,生存时间或生理测量值)的观测结果。
类似地,治疗队列由 \(\mathcal{D}_1 = \{(\mathbf{z}_j, h_j, A)\}_{j=1}^t\) 表示,包含 \(t\) 个受试者。这里,\(\mathbf{z}_j \in \mathbb{R}^d\) 是协变量向量,\(h_j \in \mathbb{R}\) 是干预后的观测结果。为了形式化研究设计,我们定义治疗剂量 \(A \in \{1, ..., m\}\)。通常,参数 \(A\) 也可以附加到对照患者,假设条件 \(A=0\)。然而,在所提出模型的背景下这并非必要。
采用潜在结果框架,让 \(Y\) 和 \(H\) 分别表示受试者在对照和治疗(\(A \geq 1\))下的反事实结果。与针对条件平均治疗效果 (CATE) 的传统方法不同,我们的推断侧重于个体获益的概率。具体来说,对于协变量向量 \(\mathbf{X}=\mathbf{x}\) 的受试者,我们旨在估计:
\[
\Psi(\mathbf{x}) = \Pr\left(H > Y \mid \mathbf{X}=\mathbf{x}\right).
\tag{2}
\]
该量提供了个体层面治疗有效性的概率评估,超越了结果差异的期望,捕捉了特定患者治疗优于对照的可能性。
## 3 作为分类任务的治疗获益概率
所提出模型背后的三个主要思想如下:(1) 成对患者比较;(2) 治疗剂量作为治疗患者特征向量中的附加特征;(3) 用于计算来自对照组和治疗组的一对患者结果差异为正的概率的注意力机制。
### 3.1 成对患者比较
核心方法涉及构建不同队列患者之间的成对比较。具体来说,我们形成由一名治疗组患者 \((\mathbf{z}_i, h_i)\) 和一名对照组患者 \((\mathbf{x}_j, y_j)\) 组成的配对。每对的治疗效果量化为 \(\Delta_{ij} = h_i - y_j\)。
我们将所有有序的治疗效果值 \(\Delta_{ij}\) (其中 \(i=1,\dots,t\) 且 \(j=1,\dots,c\) )收集到两个子集 \(\mathcal{G}^+\) 和 \(\mathcal{G}^-\) 中,分别对应 \(\Delta_{ij}\) 为正和为负,即:
\[
\mathcal{G}^+ = \{\Delta_{ij}: \Delta_{ij} > 0\}, \quad \mathcal{G}^- = \{\Delta_{ij}: \Delta_{ij} \leq 0\}.
\tag{3}
\]
考虑 \(\Delta_{ij}\) 的子集,其值可以属于区间 \((0, +\infty)\),并引入指标集 \(\mathcal{R}^+\) 对应于所有具有正值 \(\Delta_{ij}\) 的观测对(来自 \(\mathcal{G}^+\)):
\[
\mathcal{R}^+ = \{(i,j): \Delta_{ij} > 0\}.
\]相似文章
图数据中差异化网络效应的处理效应估计
本文通过建模差异化网络效应解决了从图数据中估计个体处理效应的挑战,提出了一种包含部分注意力和信息放大器的机制,以捕捉邻居的不同重要性和规模。实验表明,该方法性能优于现有方法。
基于主动推理的个性化癌症治疗信念空间控制
本文将癌症治疗建模为使用主动推理的信念空间规划问题,推导出一个预期自由能目标,该目标在测量预算约束下统一了目标导向控制与信息获取。该框架在AACR Project GENIE的真实临床数据上得到验证,展示了同时进行患者分类与高治疗疗效的能力。
基于数字孪生模拟的治疗响应优化临床决策支持AI系统
本文提出了一种在线自适应的临床决策支持AI系统,该系统整合了治疗效果估计、数字孪生模拟和强化学习,以在安全、临床医生监督的方式下推荐治疗方案,并在合成模拟器和TCGA卵巢癌数据集上进行了验证。
ARIA: 基于自适应区域重要性分配的条件扩散蒸馏
本文介绍了ARIA框架,该框架自适应地在条件空间的各个区域分配训练资源,用于蒸馏条件扩散模型,从而提升在未见和低表征条件下的性能。
干预还是不干预:使用概率模型融合引导推理时对齐
本文介绍了BlendIn,一个推理时对齐框架,它使用概率模型融合来评估指导可靠性并按比例加权模型贡献,通过避免有害干预实现了高达50%的性能提升。