面向约束感知干预设计的因果智能以诱导状态转换

arXiv cs.LG 2026/05/29 04:00 论文

摘要

本文介绍了一种因果智能框架COAST，用于设计约束感知干预，驱动复杂系统在状态间转换。该框架整合了因果发现、因果建模和多目标优化，以识别具有机制解释的最小有效干预策略。

arXiv:2605.29008v1 Announce Type: new 摘要：通过定向干预驱动系统从一种状态转换到另一种状态是科学中的一个基本挑战，然而大多数预测模型提供的机制洞察有限，且缺乏原则性的决策框架。本文提出COAST（Causally Optimal Actions for State Transitions，状态转换因果最优动作），一种用于约束干预的计算机辅助设计的因果智能方法，以诱导用户定义的状态转换。给定表征源状态和目标状态的数据，COAST学习上下文特定的因果图和结构因果模型，将观察到的分布偏移归因于机制层面的因果驱动因素，并引入了一种新颖的约束感知多目标优化公式，以平衡转换有效性、干预复杂性和目标状态稳定性。该方法是模块化和领域无关的，通过可互换组件整合了特征选择、因果发现、因果建模以及干预识别和评估。在合成基准和真实生物数据集上，COAST恢复了关键的因果驱动因素，并识别出稳健的单目标和多目标干预策略，实现了期望的状态转换，同时提供透明的机制解释以指导实验验证。

查看原文

查看缓存全文

缓存时间: 2026/05/29 09:14

# 面向约束感知干预设计的因果智能方法：诱导状态转变

来源：https://arxiv.org/html/2605.29008

\equalcont 这些作者对本文贡献相同。\[1\]\\fnmDimitris V\.\\surManatakis\\equalcont这些作者对本文贡献相同。1\]\\orgnameMRL，Merck & Co\., Inc\.,\\orgaddress\\street33 Avenue Louis Pasteur,\\city波士顿,\\postcode02115,\\state马萨诸塞州,\\country美国

###### 摘要

通过靶向干预将系统从一个状态驱动到另一个状态是科学中的基本挑战，然而大多数预测模型提供的机制洞察有限，并且缺乏原则性的决策框架。本文提出COAST（Causally Optimal Actions for State Transitions，状态转变的因果最优行动），一种用于*计算机内*设计约束干预以诱导用户定义的状态转变的因果智能方法。给定表征源状态和目标状态的数据，COAST学习上下文特定的因果图与结构因果模型，将观察到的分布变化归因于机制层面的因果驱动因素，并引入一种新颖的约束感知多目标优化公式，平衡转变效能、干预复杂性和目标状态稳定性。该方法模块化且领域无关，通过可互换组件集成了特征选择、因果发现、因果建模以及干预识别与评估。在合成基准和真实生物数据集上，COAST能够恢复关键因果驱动因素，并识别稳健的单靶点和多靶点干预策略，实现期望的状态转变，同时提供透明的机制解释以指导实验验证。

###### 关键词：因果智能；因果推断；最优干预设计；状态转变；多目标优化；精准医学

## 1 引言

识别最小但有效的干预措施，以驱动复杂系统从一个状态转变到另一个状态，是科学与工程中的基本挑战\[1 (https://arxiv.org/html/2605.29008#bib.bib1)\]。在生物医学中，状态转变涵盖从健康到疾病的进展、不同疾病阶段或肿瘤亚型之间的转换，以及分化过程中的谱系决策，这些现象通常表示为相互作用实体的网络\[2 (https://arxiv.org/html/2605.29008#bib.bib2),3 (https://arxiv.org/html/2605.29008#bib.bib3),4 (https://arxiv.org/html/2605.29008#bib.bib4)\]。这些动态受因果原理支配。因此，学习构建此类机制的因果关系是模型的基本前提，这些模型不仅能解释观察结果，还能可靠地预测单一或组合干预的效果。这种能力使得能够在*计算机内*识别并优先选择能够实现期望结果的干预措施，例如阻止病理进展或逆转疾病状态，同时减少实验负担并加速发现。

传统的AI/ML系统优化于捕捉统计关联并最大化预测准确性。按其设计，它们不识别原因，因此很少提供假设驱动推理或反事实*假设*分析所需的机制洞察\[5 (https://arxiv.org/html/2605.29008#bib.bib5),6 (https://arxiv.org/html/2605.29008#bib.bib6)\]。复杂系统中的稳健决策支持需要将因果推理置于核心的方法，超越模式识别，走向对机制、干预及其后果的显式模型。

生物学和药物发现中的核心挑战是识别能够因果驱动特定生物过程或疾病机制的靶点最小集合，通常需要组合使用。应对这一挑战需要模型能够：(i) 区分因果驱动因素与相关效应，(ii) 将观察到的状态差异归因于特定机制，(iii) 显式推理约束干预的结果。这定义了一个*逆向设计*问题，与正向响应预测有根本区别\[7 (https://arxiv.org/html/2605.29008#bib.bib7),8 (https://arxiv.org/html/2605.29008#bib.bib8),9 (https://arxiv.org/html/2605.29008#bib.bib9),10 (https://arxiv.org/html/2605.29008#bib.bib10),11 (https://arxiv.org/html/2605.29008#bib.bib11)\]。目标不是预测系统对已知扰动的响应，而是识别哪些干预措施能够将其驱动到期望状态，同时尊重机制和实际约束。

近年来的计算框架在预测转录对遗传和化学扰动的响应方面取得了显著进展。诸如scGen\[7 (https://arxiv.org/html/2605.29008#bib.bib7)\]、CPA\[8 (https://arxiv.org/html/2605.29008#bib.bib8)\]、GEARS\[10 (https://arxiv.org/html/2605.29008#bib.bib10)\]和CellOT\[11 (https://arxiv.org/html/2605.29008#bib.bib11)\]等方法采用深度生成或最优传输公式来推断扰动效应，并展现出对未见条件的泛化能力。这些方法在响应预测和数据增强方面非常有效，但并非旨在解决逆向设计问题。它们既不推断实验特定的因果结构，也不提供支持可解释因果决策的机制层面归因。

PDGrapher更直接地针对逆向设计目标，将有效扰动的识别公式化为监督学习任务，利用大规模遗传和化学扰动库以及基于图的架构来预测能够诱导期望转录状态变化的扰动原\[12 (https://arxiv.org/html/2605.29008#bib.bib12)\]。当大规模配对扰动-响应数据可用时，该范式取得了强劲的实证性能。然而，PDGrapher不进行因果结构学习，而是操作于预定义的生物相互作用网络，学习扰动与转录结果之间的预测关系，而不是显式估计因果效应或构建机制图。因此，它无法识别哪些上游调节因子因果地解释了源状态和目标状态之间的观察差异，也无法将状态转变归因于特定的失调机制。结果，它不支持实验特定的机制推理（例如*为何存在给定的状态差异*以及*哪些因果通路驱动了它*），而这种推理是依据生物学原理优先选择靶点所必需的。此外，对干预的实际约束（如可药性、毒性阈值或组合可行性）并未显式纳入其目标函数。

因此，*哪些机制因果地解释了两种状态之间的转变*，以及*在明确的生物学和实际约束下如何最优干预*，这些问题仍然悬而未决。

我们提出COAST（Causally Optimal Actions for State Transitions，状态转变的因果最优行动），这是一个模块化、领域无关的因果智能框架，用于识别约束感知的干预措施，以诱导用户定义的状态转变。给定表征源状态和目标状态的数据，COAST旨在识别单一或组合干预措施，其*causal effects*足以诱导期望的状态转变，同时明确考虑机制、生物学和实际可行性约束。为了实现这一优化，COAST：(i) 执行上下文特定的特征选择，从手头数据中定义生物学上有意义的建模空间；(ii) 学习上下文特定的因果图及相关的结构因果模型，以捕捉所研究系统中活跃的机制；(iii) 将观察到的源状态与目标状态之间的分布偏移归因于机制层面的因果驱动因素。这些组件共同支撑了COAST的核心创新：一个多目标因果优化公式，在显式约束下直接搜索可行的干预集合，平衡转变效能、目标状态稳定性和干预稀疏性。重要的是，特征选择、因果发现和建模组件是模块化和可互换的，使COAST能够适应不同的数据模态和建模假设，而不改变底层的优化问题。

尽管COAST按其构造是领域无关的，但我们在此重点关注生物医学应用，因为在这些应用中识别因果驱动因素和可解释的干预策略对于假设生成和实验优先级排序至关重要。在此场景下，COAST通过将机制层面归因与约束优化联系起来，实现有原则的干预设计，允许在转变效能与干预复杂性之间进行权衡，同时确保所提出的干预满足生物学和实际可行性约束。该框架产生可检查的机制解释，直接为实验优先级排序提供信息。

通过在具有不同正则化强度（λ\\lambda）的范围内求解该优化问题，COAST产生一系列在密度上变化的干预策略；在稀疏和稠密解中一致出现的靶点提供了内在的稳健性信号，其持续性独立于任何特定的正则化选择。这些特性共同使COAST能够解决大规模扰动模型所未涉及的一类问题：直接从观察性或干预性数据推导出有原则、有机制基础的干预策略，而不依赖于扰动图谱。这使得COAST特别适用于缺乏此类库但可获取表征源状态和目标状态数据的场景，包括早期疾病研究和特征不充分的生物学环境，在这些环境中可以收集观察数据，但系统性的扰动资源和机制知识仍然有限。

## 2 结果

我们通过评估COAST识别正确且生物学上有意义的干预措施以驱动系统在不同状态之间转变的能力来评估它。首先，使用具有已知真实值的受控合成基准，我们测试COAST是否恢复了潜在状态转变的真实因果驱动因素和干预靶点。其次，使用Perturb-seq数据，我们评估COAST是否正确识别了负责观察到的转录变化的实际遗传扰动。最后，使用捕捉细胞状态之间转变的单细胞RNA-seq数据，我们评估COAST提出的干预措施的下游效应是否激活了控制相应状态转变的生物学通路。

### 2.1 COAST概述

COAST是一种因果智能方法，用于识别驱动系统从源状态S\\mathcal\{S\}到期望目标状态T\\mathcal\{T\}的单一或组合干预（图1 (https://arxiv.org/html/2605.29008#S2.F1)）。它实现了一个有原则的端到端因果流水线，由六个紧密耦合的模块组成，每个模块的输出作为后续阶段的必要输入。这些模块共同形成一个因果连贯的链条，将观察性或干预性数据映射到可执行的干预策略。完整的方法细节见第4节 (https://arxiv.org/html/2605.29008#S4)。

---

参见图注

图1：COAST框架概述。COAST通过六个紧密耦合的模块识别驱动系统从源状态S\\mathcal\{S\}到目标状态T\\mathcal\{T\}的单一或组合干预：特征选择、因果发现、因果建模、根因分析、最优干预识别以及干预评估。从源数据和目标数据（DSD^\{\\mathcal\{S\}\}和DTD^\{\\mathcal\{T\}\}）开始，COAST首先执行上下文特定的特征选择并学习因果图结构。根据推断出的图结构和相应数据，COAST随后拟合上下文特定的因果模型Mc\\mathcal\{M\}^\{c\}，c∈\{S,T\}c\\in\\\{\\mathcal\{S\},\\mathcal\{T\}\\\}。接着，COAST将观察到的状态差异归因于机制层面的因果驱动因素，并求解一个新颖的约束感知多目标优化问题，以提出可行的干预集合。候选干预随后被排序、在*计算机内*模拟，并使用领域特定标准进行评估。

该流水线从**特征选择**开始，通过识别在S\\mathcal\{S\}与T\\mathcal\{T\}之间表现出显著差异行为的特征来定义上下文特定的建模空间，并可选择性地加入先验知识变量和通过调控网络分析推断的上游调节因子。这个聚焦的特征集随后被传递到**因果发现**，该模块学习有向无环图（DAG），编码所选特征之间假定的因果关系。COAST不将DSD^\{\\mathcal\{S\}\}和DTD^\{\\mathcal\{T\}\}合并，而是将它们视为不同的状态，支持多环境结构学习策略，可根据领域假设恢复共享的因果主干或状态特定的图。推断出的图随后被用于**因果建模**，拟合状态特定的结构因果模型（SCM）MS\\mathcal\{M\}^\{\\mathcal\{S\}\}和MT\\mathcal\{M\}^\{\\mathcal\{T\}\}，这些模型参数化每个状态中活跃的因果机制，并作为*计算机内*代理来模拟候选干预的下游效应。

基于学习到的因果结构，**根因分析**采用机制层面归因来量化每个变量条件分布的变化对观察到的状态差异的贡献，生成因果驱动因素的排序列表，定义并缩小干预搜索空间。这些排序后的驱动因素直接为**最优干预识别器**提供信息，该识别器构建了一个新颖的约束多目标优化问题，输出最小干预集合，使得干预后分布最大程度地将S\\mathcal\{S\}对齐到T\\mathcal\{T\}，同时联合权衡转变效能、干预稀疏性和目标状态稳定性，并强制执行实际可行性约束，如可药性和相对变化界限。通过在一系列正则化强度（λ\\lambda）上求解该优化，COAST产生一系列解，从中间确定在不同正则化值下一致出现的干预策略为稳健策略。最后，**干预评估**按转变百分比对候选策略进行排序，通过拟合的SCM进行*计算机内*模拟量化下游效应，并通过领域特定标准（在生物医学场景中，为通路富集和疾病关联分析）进行结果关联，以优先选择干预措施进行实验跟进。

---

参见图注

图2：在合成数据集上的结果。COAST与边际分布分析（MDA）基线在100节点图上、不同噪声水平（低：σ=1\\sigma=1，中：σ=3\\sigma=3，高：σ=5\\sigma=5）下的比较。每行内，面板对应不同数量的真实干预靶点（k∈\{1,5,10\}k\\in\\\{1,5,10\\\}）。柱高表示五个随机种子的平均值，黑点显示单个种子值。(a) Recall@kk，衡量所选靶点中真实干预靶点的比例，选择基于前kk个排名的靶点（kk匹配真实靶点数量）。COAST在所有设置下均接近完美召回，而MDA表现出显著更低的召回率。

面向约束感知干预设计的因果智能以诱导状态转换

相似文章

PACER: 从大规模干预数据中进行无环因果发现

CausaLab: 面向AI科学家的可扩展交互式因果发现环境

Context：通过可组合沙箱程序、声明式布线及结构化交互实现主动目标导向智能

ReplaySCM：基于干预数据执行因果机制归纳的基准测试

工具即连续流：用于演进式智能体推理

提交意见反馈