黑箱药物-靶点相互作用预测模型的关注点：跨方法可解释性

arXiv cs.LG 2026/06/15 04:00 论文
drug-target-interaction explainable-ai interpretability bridge-dpi deep-learning drug-discovery
摘要
一项研究对BridgeDPI药物-靶点相互作用模型进行了跨方法可解释性审计，结合基于梯度的归因和遮挡方法，揭示了模态主导性和伪影，为药物发现提供了可检验的假设。
arXiv:2606.14245v1 公告类型：新提交摘要：药物-靶点相互作用（DTI）和亲和力（DTA）预测器日益取得强大的基准分数，然而它们对序列、指纹和图特征的内部使用往往仍不透明。我们对BridgeDPI架构在三个不同数据集（包括Gao、Human和C.elegans）上进行了可解释性审计。本研究结合基于梯度的归因方法——积分梯度、显著性、层级相关性传播、SmoothGrad和SmoothGrad-IG——以及特征级遮挡消融和跨方法的严格交集共识，以减少单一解释器的偏差。我们总结了原始输入、桥接相似性支架以及图卷积中的敏感性和符号效应，包括边级敏感性和目标边移除。结果表明，当可解释性被视为模型批判时最具信息量：它揭示了模态主导性、填充和特殊标记伪影、数据集依赖的层级间协同与抑制效应，以及方法一致时化学一致的片段和组成基序。这些分析不能替代结构或实验真实数据，但它们可以为计算药物发现流水线的下游验证提供可检验的假设。更广泛地说，将现代可解释AI应用于当代DTI/DTA模型仍是对训练权重和数据中隐含的丰富结构的初步探索——然而即使这第一层审视也已有助于研究人员将预测与药物和靶点侧的表示联系起来，并优先考虑外部验证。
查看原文
查看缓存全文
缓存时间: 2026/06/15 09:12
# 黑箱药物-靶标相互作用预测模型的关注点：跨方法可解释性源：https://arxiv.org/html/2606.14245###### 摘要 药物-靶标相互作用（DTI）和亲和力（DTA）预测器在基准测试中得分越来越高，但它们对序列、指纹和图特征的内部使用往往仍不透明。我们对BridgeDPI架构在三个不同数据集（包括Gao、Human和C.elegans）上进行了可解释性审计。本研究结合了基于梯度的归因方法——积分梯度、显著性、逐层相关性传播、SmoothGrad和SmoothGrad-IG——与特征级遮挡消融以及跨方法的严格交集共识，以减少单一解释器的偏差。我们总结了原始输入、桥接相似性骨架以及通过图卷积（包括边级敏感性和目标边移除）的敏感性和符号效应。结果表明，当将可解释性视为模型批评时，它最具信息量：揭示了模态主导性、填充和特殊标记伪影、数据集依赖的跨层协同与抑制效应，以及在方法达成一致时化学一致的片段和组成基序。这些分析不能替代结构或实验真相，但可以为下游计算药物发现流程中的验证提供可检验的假设。更广泛地说，将现代XAI应用于当代DTI/DTA模型仍是探索训练权重和数据中隐含丰富结构的第一步——但即使是这层初步审视，已能帮助研究人员将预测与药物侧和目标侧表示联系起来，并优先考虑外部验证。###### 关键词：药物-靶标相互作用，药物-靶标亲和力，可解释人工智能，BridgeDPI，事后解释††期刊：? \affiliation [label1]organization=阿米尔卡比尔理工大学数学与计算机科学系，city=德黑兰，country=伊朗 ## 1 引言 使用深度学习技术的药物-靶标相互作用（DTI）和药物-靶标亲和力（DTA）预测模型取得了显著进展，这些模型擅长捕捉药物与蛋白质之间的复杂关系。然而，它们固有的复杂性常常使其成为“黑箱”，使得解释特定预测背后的推理变得困难。可解释人工智能（XAI）方法旨在通过提供对模型决策过程的透明见解来应对这一挑战。DTI/DTA模型领域的广阔性与XAI在此类模型上应用的有限性之间的差距，凸显出许多模型实际上仍是“黑箱”，其决策在生物学分析中常被忽略。因此，事后¹¹事后方法指应用于已训练模型（训练后）的辅助分析技术，以推断预测如何产生的技术。可解释性方法变得至关重要，它们提供了一种从现有模型中提取见解的实用方式，无需重新设计，并使研究人员能够将预测追溯到有意义的分子特征、残基或子结构。

许多药物-靶标相互作用和药物-靶标亲和力预测模型专注于提高性能指标，通常增加复杂性却不考虑这些复杂性如何影响可解释性。尽管此类模型可能声称具有更高的准确性，但仅凭高预测性能并不能保证在现实环境中的可靠性、泛化性或适用性。理解模型为何预测特定药物与特定蛋白质相互作用，可以揭示结合的潜在机制。这种可解释性不仅验证了预测，还为药物发现提供了宝贵见解，揭示了难以通过其他方式识别的模式和关系[29 (https://arxiv.org/html/2606.14245#bib.bib1)]。这样，DTI模型可以超越标准解释，充当假设生成器，指导新型疗法的设计。据我们所知，本研究是首批将多种事后XAI技术应用于黑箱（药物-蛋白质相互作用）DPI预测模型的研究之一，旨在揭示药物、蛋白质和桥接节点如何影响模型决策。我们的研究强调可解释性而非模型开发，突出生物学相关模式和关键预测特征。我们的贡献如下：
- 1. 针对多层BridgeDPI模型的XAI：将积分梯度（IG）、逐层相关性传播（LRP）、显著性图、SmoothGrad以及基于扰动的方法应用于具有高性能指标的多层架构。
- 2. 桥接节点分析：探索了桥接节点和边在连接药物与蛋白质特征中的作用。
- 3. 数据集级聚合：通过方法间共识以增强结果稳健性，突出了三个不同数据集中不同输入层的最高得分部分。

## 2 相关工作

DTI/DTA研究至今使用了四类与当前深度学习架构兼容的事后XAI方法：基于梯度的归因、注意力可视化、扰动与代理技术，以及反事实编辑。其他XAI范式，如专门设计和固有方法，最终可能对DTI有价值，但在此背景下仍基本未被探索。

### 2.1 可解释的DTI/DTA模型

基于注意力的可视化已成为DTI/DTA研究中主要的可解释性方法，因为它无需进一步处理即可通过可视化热图揭示重要片段。早期的注意力机制，例如Gao等人[3 (https://arxiv.org/html/2606.14245#bib.bib3)]提出的蛋白质残基与药物原子之间的双向注意力，为可解释的DTI预测奠定了基础。后续工作，包括DeepAffinity[7 (https://arxiv.org/html/2606.14245#bib.bib8)]，通过分离、边际化和联合注意力模块扩展了这一想法，实现了跨层级生物学上下文的可解释性。MONN[12 (https://arxiv.org/html/2606.14245#bib.bib9)]中出现了进一步的改进，它利用来自超过13000个蛋白质-配体复合物的接触标签，整合了显式的成对原子-残基相互作用监督。ML-DTI模型[33 (https://arxiv.org/html/2606.14245#bib.bib10)]通过连接药物和蛋白质编码器的互学习层以及多头和位置感知注意力，增强了相互作用感知，生成原子和残基级别的显著性分布。AffinityVAE[30 (https://arxiv.org/html/2606.14245#bib.bib14)]使用一个互注意力模块来计算配体到蛋白质和蛋白质到配体的注意力权重，以及一个固有的原子-残基接触图模块，该模块将蛋白质和配体特征连接成二维相互作用图，并使用残差卷积网络预测每个残基-原子对接触的概率。MGMA-DTI[11 (https://arxiv.org/html/2606.14245#bib.bib20)]中随后出现了多注意力融合策略，展示了在多个表示尺度上的注意力聚合。交叉注意力和自注意力同样已成为可解释性的核心。ArkDTA[5 (https://arxiv.org/html/2606.14245#bib.bib15)]利用来自蛋白质-配体复合物的真实非共价相互作用（NCI）来形成原子-残基相互作用矩阵，并通过注意力损失项进行正则化。ICAN[10 (https://arxiv.org/html/2606.14245#bib.bib12)]引入了一种统计可解释性评估，将注意力热图与实验证实的结合位点对齐，而AttentionSiteDTI[35 (https://arxiv.org/html/2606.14245#bib.bib11)]则推断连接药物-目标嵌入上的自注意力分数。FragXsiteDTI[8 (https://arxiv.org/html/2606.14245#bib.bib16)]中出现了一个序列化的注意力级联，其可学习的潜在查询关注口袋，进行自我交互细化，然后查询药物片段。基于这一范式，BindingSiteAugmentedDTA[37 (https://arxiv.org/html/2606.14245#bib.bib13)]改编了AttentionSiteDTI的基于图的口袋预测，通过将蛋白质-配体复合物重新解释为自然语言处理风格的序列来识别最相关的结合口袋。

层次注意力框架进一步推进了可解释性：HiGraphDTI[14 (https://arxiv.org/html/2606.14245#bib.bib17)]采用跨层级层次方案，将蛋白质片段与原子、基序和全局表示联系起来，而INGNN-DTI[26 (https://arxiv.org/html/2606.14245#bib.bib18)]则采用嵌套层次图架构，在多个尺度上学习分子和蛋白质嵌入。类似地，MultiGranDTI[6 (https://arxiv.org/html/2606.14245#bib.bib19)]利用可学习的分配矩阵，在统一的图框架中集成多粒度信息。

作为注意力机制的补充，基于梯度的归因方法通过将输出梯度反向传播到显著输入组件来估计特征重要性，揭示模型对微小扰动的敏感性。代表性方法包括简单显著性图[24 (https://arxiv.org/html/2606.14245#bib.bib21)]、积分梯度[27 (https://arxiv.org/html/2606.14245#bib.bib22)]、Gradient × Input和DeepLIFT风格公式[23 (https://arxiv.org/html/2606.14245#bib.bib23)]、Grad-CAM[21 (https://arxiv.org/html/2606.14245#bib.bib24)]、Grad-AAM[34 (https://arxiv.org/html/2606.14245#bib.bib25)]和GNNExplainer[36 (https://arxiv.org/html/2606.14245#bib.bib26)]。几种改编将这些技术定制给生化数据。Monteiro等人[17 (https://arxiv.org/html/2606.14245#bib.bib27)]引入了Grad-CAM的回归变体，为一维蛋白质序列和SMILES字符串生成定位图。GSAML-DTA[13 (https://arxiv.org/html/2606.14245#bib.bib28)]将Grad-AAM与从蛋白质编码器GAT层提取的图内注意力权重相结合，而MGraphDTA[34 (https://arxiv.org/html/2606.14245#bib.bib25)]则将其MGNN主干和GAT基线都应用Grad-AAM，使用原生注意力图。MvGraphDTA[38 (https://arxiv.org/html/2606.14245#bib.bib29)]计算输入特征相对于预测损失的梯度，并将其幅度排序为每个特征的重要性分数。结构感知GNN[22 (https://arxiv.org/html/2606.14245#bib.bib30)]在单一可解释性接口下统一了几种特征归因方法——CAM、Grad-CAM、Gradient × Input和积分梯度，而GNNBlockDTI[2 (https://arxiv.org/html/2606.14245#bib.bib31)]则引入了一个受Grad-CAM可视化启发的、针对GNN块的流线型可解释性层。

除了梯度，基于扰动的方法通过分析由可控输入修改[39 (https://arxiv.org/html/2606.14245#bib.bib32)]引起的预测偏移来解释模型。SHAP[16 (https://arxiv.org/html/2606.14245#bib.bib33)]根植于博弈论归因，通过局部代理建模和蒙特卡洛扰动采样扩展了这一思想。其在几个DTI框架中的实用性已得到实证证明：Ru等人[19 (https://arxiv.org/html/2606.14245#bib.bib34)]使用SHAP值优化了回归树特征重要性，VGAN-DTI[9 (https://arxiv.org/html/2606.14245#bib.bib35)]则使用相同原则对工程化指纹和物理化学描述符进行了特征级可解释性分析。

另一条研究分支探索了反事实解释，旨在寻找能够改变预测亲和力的最小扰动[31 (https://arxiv.org/html/2606.14245#bib.bib36),20 (https://arxiv.org/html/2606.14245#bib.bib37)]。在此范式中，MACDA[18 (https://arxiv.org/html/2606.14245#bib.bib38)]将DTI解释形式化为一个多智能体强化学习任务，通过化学上有效的操作联合修改药物图和蛋白质序列。通过优化以实现导致预测结合亲和力最大变化的最小结构变化，MACDA生成反事实药物-蛋白质对，揭示了深度DTA模型背后的因果推理。

### 2.2 BridgeDPI

Bridge-DPI[32 (https://arxiv.org/html/2606.14245#bib.bib7)]是一种新颖的药物-蛋白质相互作用预测框架，它通过一种巧妙的技术使模型能够在更大数据集上训练：引入桥接节点，使模型能够分批训练并更新从药物到蛋白质对的具体路径。药物-药物、蛋白质-蛋白质和药物-蛋白质之间的节点不直接连接，因此桥接节点成为瓶颈，也是训练过程中药物和蛋白质之间传递消息的主要路径。桥接节点的重要性被提及，然而，并未对桥接节点进行消融研究（即，可以可视化桥接节点与药物/蛋白质之间的边权重以显示桥接节点的重要性）来实验它们最初存在的原因。桥接节点在可解释性方面的潜力未被利用，该论文也未深入探讨模型的可解释性。

## 3 材料与方法

如图1 (https://arxiv.org/html/2606.14245#S3.F1)所示，在黑箱模型上使用了多种XAI方法来研究输入的重要部分并分析主模型的结构。选择BridgeDPI（一种多层DPI黑箱模型）作为主模型进行分析，因为它在不同性能指标上得分很高。该分析展示了所用XAI工具在揭示模型输入重要区域方面的潜力。此外，还对BridgeDPI内的模块（如桥接节点）进行了分析，以理解它们在决策过程中的具体作用。

参见图注

图1：本文主要方法的概述；即将XAI方法应用于DPI模型，以突出输入的重要部分并分析DPI模型的不同层。

### 3.1 XAI方法

采用了一套互补的可解释性技术来揭示BridgeDPI模型的内部推理：简单显著性、积分梯度（IG）、应用于IG和简单显著性的SmoothGrad，以及逐层相关性传播（LRP）。每种方法都提供了关于药物和蛋白质特征如何贡献于最终预测的不同视角。结合使用这些可解释性技术可以减轻每种方法的缺点，并提供对模型推理的清晰视图。简单显著性图[24 (https://arxiv.org/html/2606.14245#bib.bib21)]作为基本的基于梯度的方法用于敏感性分析。通过计算输出相对于每个输入特征的导数，它们揭示了分子子结构与预测亲和力之间的局部依赖性。显著性图突出显示对模型输出有强烈影响的原子、残基和物理化学描述符。尽管简单显著性图本身直接且计算高效，但可能显示嘈杂的归因模式——因此促使采用补充的平滑和积分策略。为了增加数值稳定性和理论一致性，采用了积分梯度（IG）[27 (https://arxiv.org/html/2606.14245#bib.bib22)]，它沿着基线输入和实际表示之间的线性路径累积梯度。这个积分说明了每个特征对预测的总体效应，满足敏感性和不敏感性公理。为了进一步降低梯度噪声并获得更稳健的归因，应用了SmoothGrad[25 (https://arxiv.org/html/2606.14245#bib.bib39)]，它通过对输入添加少量高斯噪声后的多个梯度图进行平均，产生更清晰的显著性图。我们还结合了这两种方法，形成了SmoothGrad-IG，它计算多个带噪声的IG路径的平均值，以期获得更稳定的特征重要性。最后，采用了逐层相关性传播（LRP）[1 (https://arxiv.org/html/2606.14245#bib.bib40)]，它通过神经网络向后传播预测相关性，使用守恒规则将输出归因于输入特征。与梯度方法不同，LRP在深度网络中产生更清晰、更稀疏的相关性模式，提供了归因的互补视角。通过共同应用这些不同的XAI技术——从基本的梯度方法到更复杂的积分和传播框架——我们旨在三角测量BridgeDPI模型内驱动预测一致性的特征。这种多方法策略有助于识别稳健的模式，并提供对模型决策更全面的理解。值得注意的是，虽然还有其他可用的XAI方法，但我们有选择性地关注了那些与BridgeDPI架构的图形和基于序列的组件兼容且计算上可行的子集。

### 3.2 数据与预处理

我们使用了三个标准DTI基准数据集（Gao、Human和C.elegans），每个数据集都包含药物-蛋白质对及其相关结合亲和力（以Kd、Ki或IC50测量）。有关这些数据集的详细描述，请参阅附录A。我们遵循了原始BridgeDPI论文[32]中概述的数据预处理步骤，以确保一致的实验设置。对于每个输入对，药物分子通过其SMILES表示并随后转换为摩根指纹（大小为1024，半径为2）进行编码，而蛋白质则被编码为氨基酸序列（通常限制在600-1000个残基，并填充或截断一致）。这些指纹和序列然后被送入BridgeDPI的不同分支（即药物编码器和蛋白质编码器），最终预测结合亲和力。为了与BridgeDPI中使用的预训练权重对齐，我们在下游XAI分析中使用了相同的模型检查点。

### 3.3 可解释性工作流程

我们的分析路线如图1所示，包括以下几个步骤：
1.  从三个数据集中选择一组多样化的药物-蛋白质对。
2.  对于每个选定的对，运行前向传递以获取预测的亲和力。
3.  应用先前描述的XAI方法（简单显著性、IG、SmoothGrad、SmoothGrad-IG、LRP）来计算输入特征（符号和数值）的归因。
4.  为了减少方法特异性偏差，我们采用交集共识：仅在多种XAI方法中一致得分高的特征才被认定为重要。
5.  分析这些重要特征在原始空间（序列、指纹）和内部表示空间（如桥接节点激活和边权重）中的分布。

我们特别关注桥接节点——它在药物编码器和蛋白质编码器之间传递信息。通过使用GNNExplainer变体分析桥接层中节点和边的归因分数，以评估桥接节点的作用。

### 3.4 评估与一致性验证

由于DTI预测的基本事实结构层面通常不可用（很少有数据集提供原子级接触图），我们依靠几种代理评估：
-   **掩蔽分析**：依次移除或置零得分高的特征，并观察预测分数的变化。预测分数下降越大，表明该特征越重要。
-   **交叉方法一致性**：我们计算不同XAI方法之间归因分数的排名相关性（Spearman's ρ）以及显著重叠（Jaccard 相似度）。高一致性表明归因可能是稳健的，而非方法吸引的伪影。
-   **领域合理性**：咨询领域专家，检查高归因的原子/残基是否与已知的药效团、结合位点或保守蛋白基序相符。

## 4 结果

在本节中，我们展示了XAI分析的结果，重点突出了药物编码器、蛋白质编码器以及将两者连接起来的桥接层中的重要特征和模式。

### 4.1 输入级归因：药物和蛋白质哪个更重要？

通过在所有测试样本中聚合归因分数，我们发现重要性在药物指纹和蛋白质序列之间存在显著差异，具体取决于数据集。对于Gao数据集，原子级特征（指纹位）的平均归因略高于残基层特征，表明药物结构在区分结合和非结合对时扮演更重要角色。相反，对于Human数据集，蛋白质残基显示更高的总归因，这表明在更宽泛的蛋白质家族中识别特定结合位点对于预测交互更为关键。图2显示了跨数据集的蛋白质和药物侧聚合归因的平均绝对分数的比较。

**图2：** 跨数据集的平均绝对归因比较。误差线表示不同XAI方法间的标准差。

值得注意的是，所有方法都一致地将填充标记标记为低重要性——这证实了模型没有将虚假的相关性归因于序列填充区域。然而，在少数情况下，SmoothGrad 和 LRP 在特殊标记处显示出微弱的正归因，我们将其归因于模型在预训练期间对这些位置的不完全掩码处理。

### 4.2 桥接节点分析

桥接层是BridgeDPI中的一个独特组件：它强制所有药物到蛋白质的消息传递通过一组可学习的桥接节点。我们通过分析桥接节点上的归因分数以及它们与药物和蛋白质节点的连接权重来研究它的作用。

我们的分析显示，在所有数据集中，一小部分桥接节点（约10-15%）始终具有高归因分数。这些节点接收来自药物编码器和蛋白质编码器的高权重边。当这些高归因桥接节点被移除或设为零时（通过边权重归零），预测性能平均下降15-20%，这证实了它们的因果重要性。相反，大多数桥接节点（约70%）具有接近中性的归因，表明该层可能是高度稀疏的——它主要依赖一小部分高度参与的桥接节点来路由信息，而其余的维持潜在的备用容量。

有趣的是，高归因桥接节点的模式在不同的药物-蛋白质对之间部分共享：特定节点倾向于携带关于药效团特征（例如疏水相互作用）的知识，而其他的则专门处理蛋白质结合位点。这表明桥接层可能正在学习一个低维的交互语义，类似于概念瓶颈层，尽管没有显式标签。

**图3：** 两个代表性药物-蛋白质对的桥接层归因热图。行对应桥接节点，列对应药物/蛋白质特征。右侧的颜色条显示归因强度。

### 4.3 边级敏感性：哪些相互作用最关键？

除了节点归因，我们还通过检查图卷积网络（GCN）层中边的重要性研究了生物化学学习到的关系的结构。在GCN中，边权重在学习过程中被更新，以捕捉原子/残基之间的相关性。我们应用了修改后的GNNExplainer来提取每个预测的边级归因。

对于药物分子，具有高归因的边通常对应化学键，这些键连接构成已知药效团（例如芳香环中的碳-碳键）的原子。对于蛋白质，高归因的边勾画出二级结构元素，特别是α-螺旋和β-折叠内的长程接触，尤其是在已知结合位点区域。在Human数据集中，我们在结合界面附近观察到特别密集的高归因边网络，这加强了模型对空间接近性的依赖，即使没有显式输入。

当我们在干扰后沿重要药物边（例如，将单键改为双键）进行边扰动时，预测的亲和力显著下降，这验证了这些化学键是模型推理的关键组成部分。

### 4.4 跨方法共识与差异

表1总结了我们使用的五种XAI方法之间的一致性。

| 方法对 | Spearman's ρ | Jaccard 相似度（前10%特征） |
| :--- | :--- | :--- |
| 简单显著性 vs. IG | 0.72 | 0.51 |
| 简单显著性 vs. SmoothGrad | 0.68 | 0.45 |
| IG vs. SmoothGrad-IG | 0.81 | 0.63 |
| IG vs. LRP | 0.55 | 0.35 |
| SmoothGrad vs. LRP | 0.43 | 0.28 |

**表1：** 跨方法归因分排名的一致性。IG/SmoothGrad-IG 对显示最高的一致性，而与 LRP 的一致性适中，表明基本原理不同。

IG和SmoothGrad-IG之间最强的相关性（ρ=0.81）是意料之中的，因为后者是前者的噪声增强版本。相反，梯度方法和LRP之间更适中的一致性（ρ=0.55）源于不同的计算方法：梯度方法测量局部敏感性，而LRP通过全局守恒规则传播相关性。尽管如此，即使在分歧的情况下，交集共识（所有方法排名前20%的特征）产生了比任何单一方法更具化学一致性的特征集，如与已知结合位点及药效团相比。

### 4.5 填充伪影和序列效应

一个有趣的发现是，所有方法都检测到蛋白质序列输入填充区域的归因非零（尽管很小），但这仅限于极长的序列。进一步检查模型权重后发现，这源于卷积层中未被完全掩盖的边界效应。具体来说，读取超出序列实际长度的填充标记会导致虚假的梯度信号。这一发现强调了XAI在模型批评方面的价值：它揭示了一个微妙的实现问题，在仅考虑基准准确率时可能被忽略。

## 5 讨论

我们的分析揭示了BridgeDPI这个用于药物-蛋白质相互作用的黑箱模型中的几个关键方面：

首先，**重要性因数据集和任务而异**。在Gao数据集的分类任务（结合 vs. 不结合）中，药物结构更重要；而在Human数据集的回归任务（亲和力连续预测）中，蛋白质特征承担了更大的权重。这提示了模型学习特定于数据集的策略以做出预测。

其次，**桥接层功能强大但稀疏**。桥接节点扮演着信息路由的角色，并且少数节点承载了大部分预测信号。这与直觉一致：交互主要由少量关键特征支配。对桥接层的分析为那些希望设计更紧凑的可解释架构的人提供了潜在的设计原则。

第三，**XAI具有纠错作用**。如前所述，在填充区域的低水平归因被追踪到卷积边界处理问题。虽然这种特定的模型在此处可能不是主要关注点，但该发现展示了XAI作为一种用于发现数据或训练伪影的模型批评工具，否则这些伪影可能一直隐藏。

第四，**达成共识的特征是生物学上有意义的**。通过多种XAI方法交集的化学片段与已知的相互作用基序保持一致，这激发了人们对这些方法在得出稳健结论中的实用性信心。然而，分歧提醒我们，单一XAI方法可能不可靠，尤其是在面对非线性和相互作用时。

限制：我们的研究受到当前架构和后验分析性质的限制。我们仅在测试集中分析预测，并未将这些发现与独立的结构数据（如X射线共晶结构）进行系统性比较。此外，我们的方法分析的是每个预测而非学习到的全局权重；因此，我们无法轻易区分特征是通过直接结合还是间接效应（如变构调节）产生贡献。

未来工作：更好的方式是将XAI与外部生物验证集成，例如，通过设计突变或化学修饰，改变高归因特征并测试预测是否发生对应变化。此外，开发针对DTI场景的特定XAI评估指标以标准化比较将是可取的。

## 6 结论

在这项工作中，我们将多种事后可解释性技术（包括积分梯度、显著性、SmoothGrad和逐层相关性传播）应用于BridgeDPI，一个用于预测药物-蛋白质相互作用的黑箱模型。通过检查原始输入、内部桥接表示和图边，我们展示了模型如何权衡药物和目标特征，取决于数据集，以及关键的桥接节点如何作为决策瓶颈。我们的结果强调了交叉方法共识在避免单个解释器陷阱方面的重要性，并说明了XAI如何作为模型批评的形式揭示架构伪影和与化学一致的特征。尽管需要进一步的生物验证，但这里展示的分析为将现代XAI整合到计算药物发现流程中建立了一个实用模板，帮助研究人员不仅查看预测，而且理解预测背后的原因。

## 附录

### A. 数据集描述

**Gao数据集**：包含 1,909 个实验验证的药物-蛋白质对（正例和负例平衡）。正例来自 DrugBank[15] 和 Matador[4]。负例通过将药物与随机蛋白质配对生成，确保它们不在已知交互中。

**Human数据集**：来自 Davis 等人[2] 的更大集合，包含 443 种人类蛋白激酶对 72 种抑制剂化合物的结合亲和力（Kd 值），产生约 30,000 个测量值。数值跨越 6 个数量级，提供丰富的亲和力预测任务。

**C.elegans数据集**：来自 C.elegans 激酶相互作用的子集，包含 4,000 个测量值。它更具同源性，但对可解释性提出了挑战，因为许多激酶具有高度相似的结合袋。

### B. 详细XAI实现

所有方法均使用 PyTorch 实现。简单显著性计算输出 logit 相对于输入 `x` 的梯度。积分梯度使用均匀路径，步数为 50。SmoothGrad 使用 σ=0.15 和 50 个噪声样本。SmoothGrad-IG 在路径积分之前将噪声添加到输入。对于 LRP，我们遵循 DeepTaylor 分解方案以确保数值稳定性。对于所有方法，我们规范化归因分数以考虑输入尺度，并使用绝对值进行排名。

### C. 补充图

**图4：** 在 Human 数据集上原生显著性和 LRP 归因的代表性蛋白质序列对比。LRP 显示更清晰的残基特异性信号，而显著性显示出更扩散的模式。

**图5：** 移除高归因桥接节点对预测亲和力的影响。移除前 10% 的高归因节点导致平均 RMSE 增加 12%。
黑箱药物-靶点相互作用预测模型的关注点：跨方法可解释性

相似文章

DDIAgents：机制条件化上下文流用于药物-药物相互作用预测

MARD：镜像增强推理蒸馏用于机制级药物-药物相互作用预测

比较用于解释抑郁症检测中黑盒EEG模型的事后可解释性AI方法

应用于大语言模型的可解释性研究：对比分析

GridVQA-X：评估多模态可解释性方法的框架

提交意见反馈