图数据中差异化网络效应的处理效应估计
摘要
本文通过建模差异化网络效应解决了从图数据中估计个体处理效应的挑战,提出了一种包含部分注意力和信息放大器的机制,以捕捉邻居的不同重要性和规模。实验表明,该方法性能优于现有方法。
arXiv:2605.24358v1 公告类型: 新
摘要: 从观测图数据中估计个体处理效应(ITE)对于商业和医学等领域的决策至关重要。由于干扰的存在,个体的结果可能受到其邻居的处理和协变量的影响,因此这项任务具有挑战性。现有方法试图建模这种干扰以实现准确的ITE估计。然而,一个重要问题经常被忽视:差异化网络效应(DNE),即由重要性和规模各异的邻居组成的局部网络所产生的效应。捕获DNE至关重要;否则,由于对干扰的错误刻画,将导致不精确的ITE估计,进而可能引发误导性的决策。为解决这一挑战,我们提出了一种新颖的干扰建模机制,该机制包含两个部分注意力机制和一个信息放大器。部分注意力机制自动估计不同邻居在干扰贡献中的重要性,而信息放大器则根据邻居的规模调整干扰建模机制的结果,从而使模型能够捕获DNE。在三个真实世界图上的实验表明,我们的方法在从图数据估计ITE方面优于现有方法,这证实了显式捕获DNE的重要性。
查看缓存全文
缓存时间: 2026/05/26 09:05
# 具有差异化网络效应的图数据治疗效果估计 来源:https://arxiv.org/html/2605.24358 (2009年6月5日) ###### 摘要\. 从观测图数据中估计个体治疗效果对于商业和医学等领域的决策至关重要。由于干扰现象的存在,个体结果可能受到其邻居的治疗和协变量的影响,使得这项任务具有挑战性。现有方法试图对此类干扰进行建模以实现准确的ITE估计。然而,一个关键问题常常被忽视:**差异化网络效应(DNE)**,即由不同重要性和规模的邻居组成的局部网络所产生的影响。捕获DNE至关重要;否则,由于对干扰的错误刻画,我们将得到不精确的ITE估计,从而导致错误的决策。为解决这一挑战,我们提出了一种新颖的干扰建模机制,该机制包含两个部分注意力机制和一个消息放大器。部分注意力机制自动估计不同邻居在产生干扰中的重要性,而消息放大器则根据邻居的规模调整干扰建模机制的结果,所有这些都使模型能够捕获DNE。在三个真实世界图上的实验表明,我们的方法在图数据的ITE估计方面优于现有方法,这证实了显式捕获DNE的重要性。 因果推断;治疗效果估计;干扰 ††copyright:acmlicensed††journalyear:2018††doi:XXXXXXX.XXXXXXX††conference:确保从权益确认邮件中输入正确的会议标题;2018年6月03-05日;纽约州伍德斯托克††isbn:978-1-4503-XXXX-X/2018/06††ccs:计算数学 因果网络††ccs:计算数学 图算法††ccs:信息系统 社交网络 ## 1.引言 来自图数据的治疗效果估计已应用于医学(Chang等,2023 (https://arxiv.org/html/2605.24358#bib.bib115);Ma等,2022a (https://arxiv.org/html/2605.24358#bib.bib109);Schnitzer,2022 (https://arxiv.org/html/2605.24358#bib.bib48))和商业(Nabi等,2022 (https://arxiv.org/html/2605.24358#bib.bib47))等多个领域的决策制定。例如,它使企业主能够评估广告是否刺激了客户购买,从而支持制定合理的促销策略决策。在此背景下,一个关键任务是估计个体治疗效果(ITE),111有时称为条件平均治疗效果(CATE)(Ma等,2022b (https://arxiv.org/html/2605.24358#bib.bib53);Shalit等,2017 (https://arxiv.org/html/2605.24358#bib.bib4))。它量化了接受治疗和未接受治疗的个体在结果上的差异(Shalit等,2017 (https://arxiv.org/html/2605.24358#bib.bib4))。我们旨在从观测图数据中估计ITE,这些数据通常包括个体的协变量、治疗、结果以及个体之间的网络结构。在这种情况下,个体的结果可能受到其邻居的治疗和协变量的影响(Ma and Tresp,2021 (https://arxiv.org/html/2605.24358#bib.bib12);Rakesh等,2018 (https://arxiv.org/html/2605.24358#bib.bib52)),这种现象被称为*干扰*(Rakesh等,2018 (https://arxiv.org/html/2605.24358#bib.bib52))。这种干扰可以在个体及其多跳邻居之间传播,这被称为*网络干扰*(Ma and Tresp,2021 (https://arxiv.org/html/2605.24358#bib.bib12))。个体的多跳邻居及其之间的连接构成了一个局部网络,该网络影响个体所接收的网络干扰。正确建模网络干扰至关重要;否则,由于不准确的ITE估计,我们将做出不合理的决策。 参见图注 图1\. 不恰当(左)和恰当(右)干扰建模机制生成表示的对比。衣着相似的个体具有相似的协变量。每个示例展示了两个相似的目标个体,它们暴露于具有不同邻居规模的局部网络中,从而导致不同程度的干扰。恰当的建模机制通过生成不同的表示来捕获这一点。相反,不恰当的机制(例如均值聚合)无法生成不同的表示。 参见图注 图2\. GITE的架构。这里,我们展示了一个包含三个个体的示例。NIML代表一个NIM层。 尽管先前研究在证明对观测图数据进行ITE估计时建模干扰的有效性方面做出了显著贡献,但其建模机制在正确捕获网络干扰方面仍存在局限性,这可能导致不精确的ITE估计。一些方法通过应用均值聚合或图卷积网络(GCN)(Welling and Kipf,2016 (https://arxiv.org/html/2605.24358#bib.bib17))来建模干扰(详见第2节 (https://arxiv.org/html/2605.24358#S2)),例如Ma and Tresp (2021 (https://arxiv.org/html/2605.24358#bib.bib12)),Jiang and Sun (2022 (https://arxiv.org/html/2605.24358#bib.bib103)),Chen等 (2024 (https://arxiv.org/html/2605.24358#bib.bib126)),以及Lin等 (2025 (https://arxiv.org/html/2605.24358#bib.bib132))。然而,这种聚合机制无法完全捕获网络干扰,因为一个关键问题被忽视了:**差异化网络效应(DNE)**,即由不同重要性和规模的邻居组成的局部网络所产生的影响。具体而言,DNE包含两个关键子问题。(I)不同邻居在产生干扰方面的重要性不同(Huang等,2023 (https://arxiv.org/html/2605.24358#bib.bib102);Lin等,2023 (https://arxiv.org/html/2605.24358#bib.bib91);Ma等,2022b (https://arxiv.org/html/2605.24358#bib.bib53);Adhikari and Zheleva,2025 (https://arxiv.org/html/2605.24358#bib.bib175))222在文献中(Huang等,2023 (https://arxiv.org/html/2605.24358#bib.bib102);Lin等,2023 (https://arxiv.org/html/2605.24358#bib.bib91);Ma等,2022b (https://arxiv.org/html/265.24358#bib.bib53);Adhikari and Zheleva,2025 (https://arxiv.org/html/2605.24358#bib.bib175)),这被称为异质性干扰或影响。然而,异质性干扰或影响不考虑DNE的子问题(II)。因此,DNE可以被视为它们的细化问题。。例如,客户的购买行为通常受其更亲密朋友的影响大于其他人。(II)邻居的规模不同,导致干扰程度不同(见图1 (https://arxiv.org/html/2605.24358#S1.F1))。拥有许多邻居的个体可能比拥有少量邻居的个体经历更严重的干扰。例如,客户的购买行为受众多朋友分享的广告影响,可能比仅由少数朋友分享的广告影响更显著。基于均值聚合或GCN的方法未能同时解决(I)和(II)这两个问题,因为它们缺乏自动估计每个邻居干扰重要性的明确机制,并且可能无法为不同邻居规模的局部网络所产生的干扰生成不同的表示。尽管有一项工作通过应用图注意力机制(GAT)(Veličković等,2017 (https://arxiv.org/html/2605.24358#bib.bib119))来估计不同邻居的重要性(Huang等,2023 (https://arxiv.org/html/2605.24358#bib.bib102);Lin等,2023 (https://arxiv.org/html/2605.24358#bib.bib91);Ma等,2022b (https://arxiv.org/html/2605.24358#bib.bib53);Zhao等,2024 (https://arxiv.org/html/2605.24358#bib.bib176)),从而考虑了问题(I),但他们的方法也没有完全解决问题(II),因为当个体相似时,它们可能会退化为均值聚合(见图1 (https://arxiv.org/html/2605.24358#S1.F1))。附录C (https://arxiv.org/html/2605.24358#A3) 中的详细证明表明,捕获DNE对于大多数现有的干扰建模方法来说仍然是一个挑战。如果不能通过联合解决问题(I)和(II)来正确捕获DNE,ITE估计将会恶化,后续决策也会被误导。 为克服捕获DNE的挑战,我们提出基于图的个体治疗效果估计(GITE),该模型在捕获DNE的同时对网络干扰的传播进行建模。一个新颖的网络干扰建模(NIM)层构成了我们方法的核心。它旨在通过两个部分注意力机制和一个消息放大器来捕获DNE。具体而言,我们设计了两个部分注意力机制:个体部分注意力(IPAtt)和结构部分注意力(SPAtt),它们旨在根据影响邻居相对重要性的两个关键因素,自适应地捕获邻居对干扰的不同贡献。IPAtt根据两个个体之间的干扰相关信息估计干扰的个体部分重要性,这有助于解决问题(I)。SPAtt根据两个个体局部网络的结构估计干扰的结构部分重要性,这有助于同时解决问题(I)和(II)。随后,NIM层使用估计的部分重要性进行聚合,并通过一个可学习的汇总函数自适应地整合聚合结果。每个部分注意力机制可以使用GAT (Veličković等,2017 (https://arxiv.org/html/2605.24358#bib.bib119)) 或Transformer的注意力机制 (Vaswani等,2017 (https://arxiv.org/html/2605.24358#bib.bib5);Ying等,2021 (https://arxiv.org/html/2605.24358#bib.bib151)) 来实现。为了精确捕获每个个体局部网络的结构信息以应用SPAtt机制,我们应用了图同构网络(GIN)(Xu等,2019 (https://arxiv.org/html/2605.24358#bib.bib133))。为解决问题(II),我们设计了一个消息放大器,根据个体的度来调整整合结果,这受到Corso等 (2020 (https://arxiv.org/html/2605.24358#bib.bib129)) 的启发。NIM层的细节在第4.1节 (https://arxiv.org/html/2605.24358#S4.SS1) 中描述。此外,我们提出了一种用于观测图数据ITE估计的表示平衡策略,详见第4.2节 (https://arxiv.org/html/2605.24358#S4.SS2)。我们在附录E (https://arxiv.org/html/2605.24358#A5) 中基于此策略对ITE估计的误差界进行了理论分析。我们总结了本研究的三个贡献,如下所示: - •我们提出了NIM层来解决DNE这一具有挑战性的问题,并进一步引入了一种基于观测图数据的ITE估计表示平衡策略。 - •我们讨论了捕获DNE对大多数现有方法仍是一个挑战(见附录C (https://arxiv.org/html/2605.24358#A3)),并基于所提出的平衡策略对ITE估计的误差界进行了理论分析(见附录E (https://arxiv.org/html/2605.24358#A5))。 - •大量实验结果表明,所提出的方法在存在网络干扰的ITE估计方面优于现有方法,这表明了捕获DNE的重要性。 ## 2.相关工作 来自带干扰观测数据的ITE估计。尽管许多研究通过假设邻居干扰(即干扰仅存在于邻近邻居之间)来建模干扰(Cai等,2023 (https://arxiv.org/html/2605.24358#bib.bib125);Chen等,2024 (https://arxiv.org/html/2605.24358#bib.bib126);Huang等,2023 (https://arxiv.org/html/2605.24358#bib.bib102);Jiang and Sun,2022 (https://arxiv.org/html/2605.24358#bib.bib103);Rakesh等,2018 (https://arxiv.org/html/2605.24358#bib.bib52);Viviano,2019 (https://arxiv.org/html/2605.24358#bib.bib11);Wu等, (https://arxiv.org/html/2605.24358#bib.bib148)),但真实世界数据通常涉及网络干扰,即干扰在个体及其多跳但有影响的邻居之间广泛传播(Lin等,2023 (https://arxiv.org/html/2605.24358#bib.bib91),2025 (https://arxiv.org/html/2605.24358#bib.bib132);Ma等,2022b (https://arxiv.org/html/2605.24358#bib.bib53);Ma and Tresp,2021 (https://arxiv.org/html/2605.24358#bib.bib12);Sui等,2024 (https://arxiv.org/html/2605.24358#bib.bib2))。具体而言,现有方法通过应用均值聚合(Cai等,2023 (https://arxiv.org/html/2605.24358#bib.bib125);Chen等,2024 (https://arxiv.org/html/2605.24358#bib.bib126);Forastiere等,2021 (https://arxiv.org/html/2605.24358#bib.bib10),2022 (https://arxiv.org/html/2605.24358#bib.bib110);Jiang and Sun,2022 (https://arxiv.org/html/2605.24358#bib.bib103))、GCN(Cai等,2023 (https://arxiv.org/html/2605.24358#bib.bib125);Chen等,2024 (https://arxiv.org/html/2605.24358#bib.bib126);Huang等,2023 (https://arxiv.org/html/2605.24358#bib.bib102);Jiang and Sun,2022 (https://arxiv.org/html/2605.24358#bib.bib103);Wu等, (https://arxiv.org/html/2605.24358#bib.bib148))或GAT(Huang等,2023 (https://arxiv.org/html/2605.24358#bib.bib102);Zhao等,2024 (https://arxiv.org/html/2605.24358#bib.bib176))来建模邻居干扰。一些研究通过均值聚合(Ma and Tresp,2021 (https://arxiv.org/html/2605.24358#bib.bib12))和GCN(Ma and Tresp,2021 (https://arxiv.org/html/2605.24358#bib.bib12);Adhikari and Zheleva,2025 (https://arxiv.org/html/2605.24358#bib.bib175))对网络干扰的传播进行建模。为了加速GNN估计器的训练,Lin等 (2025 (https://arxiv.org/html/2605.24358#bib.bib132))在训练前聚合干扰相关信息。为了从更复杂的图中估计ITE,Ma等 (2022b (https://arxiv.org/html/2605.24358#bib.bib53))和Lin等 (2023 (https://arxiv.org/html/2605.24358#bib.bib91))分别提出了从超图和异构图估计ITE的方法。当他们应用于普通图时,他们使用GAT (Veličković等,2017 (https://arxiv.org/html/2605.24358#bib.bib119))来建模干扰。尽管先前研究在带干扰的ITE估计方面做出了宝贵贡献,但其方法在捕获DNE方面仍面临挑战,详见附录C (https://arxiv.org/html/2605.24358#A3)。其他设置下治疗效果估计的对比表和研究详见附录H (https://arxiv.org/html/2605.24358#A8)。 图机器学习方法。除了基于GNN的ITE估计干扰建模方法外,图机器学习(GML)领域也提出了一些方法。尽管这些方法对GML任务有显著贡献,但它们无法从带DNE的观测图数据中估计ITE。和聚合(Liu等,2024 (https://arxiv.org/html/2605.24358#bib.bib138);Xu等,2019 (https://arxiv.org/html/2605.24358#bib.bib133))无法捕获DNE,因为它们不考虑邻居在贡献干扰方面的不同重要性。基于池化的方法也得到了探索(Liu等,2022 (https://arxiv.org/html/2605.24358#bib.bib137)),其中最大池化方法(Hamilton等,2017 (https://arxiv.org/html/2605.24358#bib.bib76))是使用最广泛的方法之一。最大池化操作无法捕获DNE,如附录C (https://arxiv.org/html/2605.24358#A3) 所证明。尽管一些研究提出了方法
相似文章
GraphDiffMed: 知识约束的差异化注意力结合药理学图先验用于药物推荐
GraphDiffMed是一个药物推荐框架,它使用双尺度差异化注意力和药理学图先验来提高在EHR数据上的推荐质量和安全性。在MIMIC-III上的实验显示出相对于基线的持续改进。
多重图中的异质性建模:一种自适应的节点分类方法
本文介绍了HAAM,一种用于多重图中节点分类的新方法,能够适应不同维度上的同质性和异质性交互。它使用维度特定的兼容性矩阵以及通过切比雪夫多项式近似的可训练低通和高通滤波器的乘积,来捕捉信号的平滑和突变变化。
用于部分因果效应识别的最优实验
本文提出了“最大效力问题”,旨在选择受成本约束的实验,以最大程度地缩小部分因果效应的界限。作者提出了图形剪枝准则以减少搜索空间,并在NHANES健康数据集上展示了该方法的应用。
建模时空图异常检测中的频谱能量偏移
提出了一种节点级频谱能量公式,用于检测图中的伪装异常,并将其扩展到具有能量驱动消息传递的时空设置。在大规模基准测试上证明了其有效性。
时间增强图注意力网络用于可供性分类
EEG-tGAT是一种时间增强的图注意力网络,通过融合时间注意力和dropout机制来改进交互序列的可供性分类。该模型在GATv2基础上进行了增强,适用于时间维度语义不均匀的序列数据。