DDGAD:基于扩散的图异常检测中的轨迹动力学
摘要
提出DDGAD,一种基于扩散的图异常检测框架,利用轨迹动力学区分正常节点与异常节点,通过可靠性感知的一致性机制和三种互补的异常信号缓解污染传播。
arXiv:2605.26446v1 Announce Type: new
摘要:图异常检测旨在识别图中行为或属性显著偏离整体模式的节点或子结构,在金融风险控制、社交网络分析和网络安全等领域具有关键应用。然而,现有的基于GCN的方法存在污染传播这一根本性问题,即异常节点通过消息传递污染其邻居的表示,导致检测性能下降。本文提出DDGAD,一种新颖的基于扩散的图异常检测框架,利用轨迹动力学区分正常节点与异常节点。我们的关键洞察是:在扩散正则化与可靠性感知邻域一致性的耦合作用下,正常节点表现出一致且稳定的表示轨迹,而异常节点由于全局流形先验与局部污染消息传递之间的方向不一致,表现出不稳定且冲突的动力学。为缓解污染传播,我们引入了一种分布式可靠性感知一致性精炼机制,并定义了三种互补的异常信号:邻居不一致性、可靠性权重和动态冲突能量。我们还对耦合动力学下的正常节点稳定性进行了初步的理论分析。这些信号分别从局部不一致性、一致性可靠性和动态不稳定性角度共同刻画异常行为。在五个真实世界数据集上的大量实验证明了所提框架的有效性。
查看缓存全文
缓存时间: 2026/05/27 09:10
# DDGAD:基于扩散的图异常检测中的轨迹动力学
来源:https://arxiv.org/html/2605.26446
###### 摘要
图异常检测(Graph Anomaly Detection,GAD)旨在识别图中行为或属性显著偏离整体模式的节点或子结构,在金融风险控制、社交网络分析和网络安全等领域具有关键应用。然而,现有的基于GCN的方法面临污染传播这一根本问题,即异常节点通过消息传递污染其邻居的表示,导致检测性能下降。本文提出DDGAD,一种新颖的基于扩散的图异常检测框架,利用轨迹动力学区分正常节点和异常节点。我们的核心洞察是:在扩散正则化与可靠性感知邻域共识的耦合作用下,正常节点表现出一致且稳定的表示轨迹,而异常节点由于其全局流形先验与局部受污染消息传递之间的方向不一致,表现出不稳定且冲突的动力学特性。为了减轻污染传播,我们引入了一种分布式可靠性感知共识细化机制,并定义了三种互补的异常信号:邻域不一致性、可靠性权重和动力学冲突能量。我们进一步对耦合动力学下正常节点的稳定性进行了初步的理论分析。这些信号从局部不一致性、共识可靠性和动力学不稳定性等角度共同刻画异常行为。在五个真实世界数据集上的大量实验证明了所提出框架的有效性。
关键词:图异常检测,轨迹动力学,动力学冲突能量,扩散-共识耦合,自适应信任共识
## I. 引言
图结构数据在从社交网络、电子商务平台到通信系统和生物网络等各种现实世界应用中普遍存在。图异常检测(GAD)专注于识别表现出异常模式的节点或子结构,因其在欺诈检测、垃圾邮件过滤和网络入侵检测中的实际重要性而受到越来越多的关注[1 (https://arxiv.org/html/2605.26446#bib.bib1)]。
尽管基于GCN的近期方法[9 (https://arxiv.org/html/2605.26446#bib.bib2)]取得了显著进展,但它们面临一个关键限制,即污染传播。由于GCN会聚合来自邻居节点的信息,异常节点可能会污染其正常邻居的表示,使得两种类型的节点难以区分。这个问题在图具有高连通性或异常形成簇时尤为严重。
为了解决这个问题,我们提出了DDGAD,一种新颖的基于扩散的图异常检测框架,它利用了节点表示在扩散过程中的动态行为。扩散模型通过学习逆转一个逐渐加噪的过程[7 (https://arxiv.org/html/2605.26446#bib.bib13)],在各种生成任务中取得了显著成功。在异常检测的背景下,扩散模型可以学习正常数据的流形,并将异常识别为偏离该流形的点。
我们的核心观察是,当受到ATC动力学作用时,正常节点和异常节点表现出根本不同的动态轨迹。正常节点的局部适应与其邻域上下文和全局数据分布一致,会迅速趋向稳定的共识轨迹。相比之下,异常节点的扩散驱动适应与其邻域共识组合相冲突,表现出不稳定和振荡的轨迹。
本文的主要贡献如下:
- • 我们提出了一种用于图异常检测的新颖动力学视角,其中异常被表征为由于扩散驱动适应与可靠性加权共识组合(ATC动力学)之间的冲突而产生的不稳定表示轨迹。
- • 我们将图异常检测形式化为一个自适应-然后-组合(ATC)动力系统,并引入了动力学冲突能量的概念,以表征受污染局部适应下的估计残差。
- • 我们引入了一种可靠性感知邻域共识机制,通过自适应信任估计来减轻污染传播。
- • 我们建立了耦合ATC动力学下正常节点的稳定性保证,并开发了一个统一的基于轨迹的异常评分框架,联合捕获局部不一致性、动力学冲突和轨迹能量。
## II. 相关工作
### II-A 图异常检测
图异常检测在文献中已被广泛研究。早期方法侧重于手工特征,如节点度、聚类系数和中心性度量[1 (https://arxiv.org/html/2605.26446#bib.bib1)]。随着深度学习的兴起,人们提出了各种基于GNN的方法,以端到端的方式学习节点表示。例如,GraphSAGE[6 (https://arxiv.org/html/2605.26446#bib.bib3)]和GAT[13 (https://arxiv.org/html/2605.26446#bib.bib4)]已被改编用于异常检测任务。然而,这些方法容易受到污染传播的影响,因为异常节点可能影响其邻居的表示。
### II-B 基于扩散的异常检测
扩散模型最近已应用于各种领域的异常检测,包括图像[2 (https://arxiv.org/html/2605.26446#bib.bib14)]和时间序列[12 (https://arxiv.org/html/2605.26446#bib.bib15)]。这些方法通常会在正常数据上训练一个扩散模型,并使用重建误差作为异常分数。在图领域,最近的一些工作探索了使用扩散模型进行异常检测[10 (https://arxiv.org/html/2605.26446#bib.bib12)]。然而,大多数这些方法将图视为静态输入,并未显式建模节点表示的动态轨迹。
### II-C 分布式鲁棒估计
分布式鲁棒估计旨在存在拜占庭对手的情况下,从局部观测估计全局参数[3 (https://arxiv.org/html/2605.26446#bib.bib16)]。这方面的工作表明,通过迭代平均和过滤局部估计,即使一部分节点是恶意的,系统也能收敛到真实参数。我们的工作从这些文献中汲取灵感,并将类似的思想应用于图异常检测,其中异常节点可以看作试图破坏共识的拜占庭对手。
## III. 方法
在本节中,我们详细介绍DDGAD框架。我们首先形式化图异常检测问题,然后描述我们方法的核心组件,最后给出异常评分机制。
### III-A 问题形式化
我们考虑一个无向图 \(\mathcal{G}=(\mathcal{V},\mathcal{E})\),其中 \(\mathcal{V}=\{v_1,v_2,\dots,v_N\}\) 是 \(N\) 个节点的集合,\(\mathcal{E}\subseteq\mathcal{V}\times\mathcal{V}\) 是边的集合。每个节点 \(v_i\) 关联一个特征向量 \(\mathbf{x}_i\in\mathbb{R}^d\)。图异常检测的目标是识别出表现异常行为的一小部分节点 \(\mathcal{A}\subset\mathcal{V}\)。
### III-B GCN中的污染传播
一个标准的GCN层更新节点表示如下:
\[
\mathbf{h}_i^{(l+1)}=\sigma\left(\sum_{j\in\mathcal{N}(i)\cup\{i\}}\frac{1}{\sqrt{d_i d_j}}\mathbf{h}_j^{(l)}\mathbf{W}^{(l)}\right) \tag{1}
\]
其中 \(\mathcal{N}(i)\) 是节点 \(v_i\) 的邻居集合,\(d_i\) 是节点 \(v_i\) 的度数,\(\mathbf{W}^{(l)}\) 是权重矩阵,\(\sigma\) 是非线性激活函数。
可以看出,每个节点的表示是其自身表示和邻居表示的加权平均。这意味着如果一个节点是异常的,它的表示将传播给所有邻居,导致局部邻域的污染。这种效应在更深的GCN中会被放大,因为来自异常节点的信息可以传播得更远。
### III-C DDGAD框架
为了更好地说明所提出的机制,我们给出了框架架构和潜在轨迹动力的直观概述。
图1:潜在空间中的轨迹动力学。(a) 正常节点和异常节点在扩散力作用下向潜在流形演化;(b) 双重力(扩散 vs. 共识)为异常节点引发冲突动力学;(c) 通过正常节点的稳定收敛和异常的、 不稳定轨迹实现最终的潜在分离。我们的DDGAD框架通过结合扩散模型与分布式鲁棒估计,朝着解决污染传播问题迈出了一步。关键思想是让节点表示通过一个ATC(Adapt-Then-Combine)过程演化:首先,每个节点通过基于扩散的去噪(Adapt)局部适应其表示;然后,每个节点使用可靠性感知权重(Combine)聚合来自邻居的适应后表示。对于正常节点,Adapt和Combine阶段是一致的,导致稳定的共识轨迹。相比之下,异常节点的局部适应与邻域共识相冲突,表现出不稳定和振荡的轨迹。
#### III-C1 扩散过程
我们采用标准的去噪扩散概率模型(DDPM)[7 (https://arxiv.org/html/2605.26446#bib.bib13)]。前向扩散过程通过添加高斯噪声逐步扰动潜在表示:
\[
q(\mathbf{z}_t|\mathbf{z}_{t-1})=\mathcal{N}\left(\mathbf{z}_t;\sqrt{1-\beta_t}\mathbf{z}_{t-1},\beta_t\mathbf{I}\right) \tag{2}
\]
其中 \(\beta_t\) 表示扩散噪声调度。
反向扩散过程旨在逐步从带噪的潜在变量中恢复干净的表示:
\[
p_\theta(\mathbf{z}_{t-1}|\mathbf{z}_t)=\mathcal{N}\left(\mathbf{z}_{t-1};\mu_\theta(\mathbf{z}_t,t),\sigma_t^2\mathbf{I}\right) \tag{3}
\]
其中 \(\mu_\theta(\cdot)\) 是一个可学习的去噪网络。
在我们的框架中,扩散是在图节点的潜在表示空间中进行的。我们首先通过一个浅层GCN编码器初始化节点嵌入:
\[
\mathbf{z}^{(0)}=\text{GCN}(\mathbf{X},\mathbf{A}) \tag{4}
\]
其中 \(\mathbf{X}\) 和 \(\mathbf{A}\) 分别表示特征矩阵和邻接矩阵。
然后,扩散模型迭代地细化潜在表示:
\[
\mathbf{z}_{\text{diff}}^{(k)}=D(\mathbf{z}^{(k)})=\mu_\theta(\mathbf{z}^{(k)},k) \tag{5}
\]
其中 \(D(\cdot)\) 表示扩散去噪算子。
#### III-C2 分布式邻域聚合
与扩散细化并行,我们进行可靠性感知的邻域聚合。与使用固定聚合权重的传统GCN不同,DDGAD根据表示一致性动态调整邻域影响。
在第 \(k\) 次迭代中,节点 \(v_i\) 的邻域共识表示计算如下:
\[
\mathbf{c}_i^{(k)}=\frac{\sum_{j\in\mathcal{N}(i)} w_{ij}^{(k)}\mathbf{z}_j^{(k)}}{\sum_{j\in\mathcal{N}(i)} w_{ij}^{(k)}} \tag{6}
\]
其中 \(w_{ij}^{(k)}\) 表示节点 \(v_i\) 和 \(v_j\) 之间的自适应可靠性权重。
自适应边权重定义为:
\[
w_{ij}^{(k)}=\exp\left(-\frac{\|\mathbf{z}_i^{(k)}-\mathbf{z}_j^{(k)}\|_2^2}{2\sigma^2}\right) \tag{7}
\]
这种自适应加权机制减少了具有不一致表示的不可信邻居的影响,从而减轻了污染传播。
### III-D 扩散-共识动力学的ATC解释
为了将我们的框架与经典分布式估计理论联系起来,我们将DDGAD更新重新解释为一个自适应-然后-组合(ATC)动力系统。关键创新在于对自创新和邻域共识的显式分解,这使得能够进行严格的数学推导以获得紧凑形式。
图2:DDGAD的框架架构。该流程由四个主要部分组成:(1) 用于初始节点嵌入的GCN编码器,(2) 带有时间信任记忆的ATC动力学用于迭代细化,(3) 异常信号累积,以及 (4) 统一异常评分。虚线表示信任加权共识聚合过程。图1 (https://arxiv.org/html/2605.26446#S3.F1) 展示了迭代过程中的潜在空间动力学。正常节点(蓝色)收敛到稳定轨迹,而异常节点(红色)由于双重力的竞争表现出冲突动力学。
#### III-D1 自适应步骤(局部流形适应)
在适应阶段,每个节点独立地使用扩散算子细化其表示:
\[
\psi_i^{(k)}=D(\mathbf{z}_i^{(k)}), \tag{8}
\]
其中 \(\psi_i^{(k)}\) 表示通过去噪向学到的正常数据流形投影后的局部适应表示。这一步骤可以解释为每个节点独立地处理其当前状态以与全局流形先验对齐,还未考虑邻域结构。
适应残差(扩散创新)为:
\[
\Delta_{D,i}^{(k)}=\psi_i^{(k)}-\mathbf{z}_i^{(k)}=D(\mathbf{z}_i^{(k)})-\mathbf{z}_i^{(k)}. \tag{9}
\]
#### III-D2 组合步骤(可靠性感知邻域共识)
在组合阶段,节点聚合来自其邻居的适应后表示,同时保持自身的自信任度。我们引入一个自信任参数 \(\alpha\in[0,1]\),用于控制信任自身创新与邻域共识之间的权衡:
\[
\mathbf{z}_i^{(k+1)}=\alpha\,\psi_i^{(k)}+(1-\alpha)\sum_{j\in\mathcal{N}(i)}\bar{w}_{ij}^{(k)}\,\psi_j^{(k)}, \tag{10}
\]
其中 \(\bar{w}_{ij}^{(k)}\) 是归一化的自适应信任权重,定义为:
\[
\bar{w}_{ij}^{(k)}=\frac{T_{ij}^{(k)}}{\sum_{m\in\mathcal{N}(i)}T_{im}^{(k)}}, \tag{11}
\]
并且 \(T_{ij}^{(k)}\) 表示节点 \(v_i\) 和 \(v_j\) 之间的时间信任状态(详见III-E节 (https://arxiv.org/html/2605.26446#S3.SS5))。
- • \(\alpha\psi_i^{(k)}\):节点的自创新项,表示对其局部适应状态的自信度。
- • \((1-\alpha)\sum_{j\in\mathcal{N}(i)}\bar{w}_{ij}^{(k)}\psi_j^{(k)}\):邻域共识项,由信任加权。
这种形式显式地分离了自创新和邻域共识,使得能够进行严格的数学推导。相似文章
TERGAD: 面向图异常检测的结构感知文本增强表示
TERGAD是一种新颖的数据增强框架,利用大语言模型将节点级别的拓扑属性转化为语义描述,然后通过门控双分支自编码器将这些语义描述与原始节点属性融合,用于图异常检测,在六个数据集上取得了最先进的结果。
建模时空图异常检测中的频谱能量偏移
提出了一种节点级频谱能量公式,用于检测图中的伪装异常,并将其扩展到具有能量驱动消息传递的时空设置。在大规模基准测试上证明了其有效性。
扩散检测:用于无监督IC异常检测的生成式扩散模型
提出了首个使用 Diffusion Transformer 进行IC潜在缺陷筛选的无监督异常检测框架,在工业16纳米测试数据上取得了最先进的性能。
Geometry-Aware Tabular Diffusion
介绍了Geometry-Aware Tabular Diffusion(GATD),该方法通过显式的成对几何特征增强表格扩散去噪器。在十个基准测试上取得了最先进的性能,同时使用的参数显著更少。
TraceGraph:用于诊断和改进智能体轨迹的共享决策景观
TraceGraph是一个基于图的框架,它从多模型智能体轨迹中构建共享决策景观,从而能够诊断故障区域并通过陷阱感知恢复流水线进行改进。