基于图信息流匹配的时空插补

arXiv cs.LG 论文

摘要

GiFlow 是一个用于时空插补的图信息流匹配框架,它用图信息先验取代高斯先验,并使用结合了空间注意力、时间注意力和时空传播的混合向量场模型。在合成数据集和真实世界数据集上均优于现有最先进方法。

arXiv:2606.06682v1 Announce Type: new 摘要:缺失数据是时空系统中的常见挑战,出现在空气质量监测和城市交通管理等应用中。传统的机器学习方法,如循环神经网络和图神经网络,依赖于迭代传播,这往往会在时间和空间上累积误差。最近的基于扩散的方法减少了误差传播,但需要迭代采样,并且通常依赖于与问题无关的高斯先验,限制了效率和效果。为解决这些局限性,我们提出了GiFlow,一种用于时空插补的图信息流匹配框架。GiFlow用通过可观测信号时空滤波构建的图信息先验取代了典型的高斯先验,这使得源分布更好地对齐目标分布,从而简化了生成轨迹。流场由一个混合向量场模型参数化,该模型集成了空间注意力、时间注意力和时空传播,实现了空间和时间依赖关系的联合建模。在合成数据集和真实世界数据集上的大量实验表明,所提出的GiFlow在时空插补中优于最先进的方法。代码可在 https://github.com/zepengzhang/GiFlow 获取。
查看原文
查看缓存全文

缓存时间: 2026/06/08 09:17

# 时空插补中的图引导流匹配
来源: https://arxiv.org/html/2606.06682

###### 摘要

数据缺失是时空系统中的常见挑战,在空气质量监测和城市交通管理等应用中频繁出现。传统的机器学习方法,如循环神经网络和图神经网络,依赖于迭代传播,这往往会在时间和空间上累积误差。近期的扩散方法缓解了误差传播,但需要迭代采样,并且通常依赖于与问题无关的高斯先验,这限制了效率和有效性。为了解决这些局限,我们提出了 **GiFlow**,一个用于时空插补的 *图引导流匹配* 框架。GiFlow 用通过时空滤波可观测信号构建的图引导先验取代了典型的高斯先验,该先验能更好地对齐源分布与目标分布,从而简化了生成轨迹。流场由一个混合向量场模型参数化,该模型整合了空间注意力、时间注意力和时空传播,能够联合建模空间和时间依赖关系。在合成和真实数据集上的大量实验表明,所提出的 GiFlow 在时空插补中优于最先进的方法。代码可在 https://github.com/zepengzhang/GiFlow 获取。

机器学习,ICML

## 1 引言

时空数据同时表征空间和时间信息,在环境科学、城市系统和气候预测等领域无处不在(Atluri 等人,2018 (https://arxiv.org/html/2606.06682#bib.bib4);Wang 等人,2020 (https://arxiv.org/html/2606.06682#bib.bib50))。在实际应用中,由于传感器故障、传输错误或系统不稳定,时空数据往往不完整(Yi 等人,2016 (https://arxiv.org/html/2606.06682#bib.bib54))。时空数据的不完整性会降低后续分析的可靠性(Ma 等人,2024 (https://arxiv.org/html/2606.06682#bib.bib32);Marisca 等人,2024 (https://arxiv.org/html/2606.06682#bib.bib34)),因此需要稳健的时空插补技术(Cao 等人,2018 (https://arxiv.org/html/2606.06682#bib.bib9);Cini 等人,2022 (https://arxiv.org/html/2606.06682#bib.bib11))。

早期的时空插补方法依赖于统计模型,这些模型对底层数据分布施加了严格假设,例如时间平滑性水平,往往无法捕捉复杂的非线性依赖关系(Liu 等人,2023a (https://arxiv.org/html/2606.06682#bib.bib27);He 等人,2025 (https://arxiv.org/html/2606.06682#bib.bib21))。深度学习方法被引入以更好地利用时空相关性。具体来说,循环神经网络 (RNN) 用于通过传播隐藏状态来捕获时间依赖性(Cao 等人,2018 (https://arxiv.org/html/2606.06682#bib.bib9)),而图神经网络 (GNN) 则用于在底层图拓扑上建模空间关系(Cini 等人,2022 (https://arxiv.org/html/2606.06682#bib.bib11))。尽管这些方法取得了成功,但它们通常依赖于在空间和时间上进行迭代传播,这可能导致误差累积和信息瓶颈(Deng 等人,2024 (https://arxiv.org/html/2606.06682#bib.bib14);He 等人,2025 (https://arxiv.org/html/2606.06682#bib.bib21);Cini 等人,2025 (https://arxiv.org/html/2606.06682#bib.bib12))。

生成模型提供了另一种范式,通过非自回归的方式推断整个数据分布。与逐步传播中间估计值的 RNN/GNN 模型不同,生成模型可以在所有可用观测数据的条件下联合进行插补,从而避免迭代传播过程中的误差累积(Liu 等人,2019 (https://arxiv.org/html/2606.06682#bib.bib30), 2023a (https://arxiv.org/html/2606.06682#bib.bib27);He 等人,2025 (https://arxiv.org/html/2606.06682#bib.bib21))。其中,扩散模型在各个领域都取得了显著成功(Croitoru 等人,2023 (https://arxiv.org/html/2606.06682#bib.bib13);Yang 等人,2023 (https://arxiv.org/html/2606.06682#bib.bib53);Cao 等人,2024 (https://arxiv.org/html/2606.06682#bib.bib8)),并且近期的工作将其应用于时空插补(Liu 等人,2023a (https://arxiv.org/html/2606.06682#bib.bib27);He 等人,2025 (https://arxiv.org/html/2606.06682#bib.bib21))。然而,扩散模型通常依赖于与问题无关的高斯先验,缺乏可用的特定问题结构。此外,扩散模型的采样需要许多迭代去噪步骤,并且插补通常需要多次采样运行后取平均,这在应用于大规模时空数据时限制了效率和鲁棒性。

近期的工作探索了流匹配 (FM) 作为扩散模型的推广,它遵循确定性的传输路径(Lipman 等人,2023 (https://arxiv.org/html/2606.06682#bib.bib26);Albergo & Vanden-Eijnden,2023 (https://arxiv.org/html/2606.06682#bib.bib1);Liu 等人,2023b (https://arxiv.org/html/2606.06682#bib.bib29))。FM 避免了随机噪声注入,支持高效的确定性采样,并且不依赖于高斯先验。这些特性使 FM 特别适用于插补等条件任务,因为部分观测编码了强结构信息。先验选择的灵活性允许 FM 拥有更短的生成路径,从而提升生成性能(Tong 等人,2024 (https://arxiv.org/html/2606.06682#bib.bib48))。基于这些见解,我们提出了 **GiFlow**,首个用于时空插补的 *图引导流匹配* 框架。与依赖与问题无关的高斯先验的现有扩散方法(Liu 等人,2023a (https://arxiv.org/html/2606.06682#bib.bib27);He 等人,2025 (https://arxiv.org/html/2606.06682#bib.bib21))不同,GiFlow 使用可观测信号的时空滤波构建图引导先验,简化了生成轨迹。结合了注意力机制和时空传播的混合向量场,我们的方法克服了 RNN 和 GNN 模型中迭代传播的局限性,以及扩散方法中的无结构先验和低效问题。

我们的贡献总结如下:

- • 我们引入了 GiFlow,一种新颖的时空插补生成模型,它将图引导先验集成到流匹配框架中。
- • 我们基于自适应时空滤波设计了一种图引导先验。与问题无关的高斯先验相比,这种针对问题的先验更符合目标分布,并且可以证明能降低传输成本。我们还从理论上分析了时空滤波过程中滤波因子与感受野之间的关系。
- • 我们在合成和真实世界数据集上进行了大量实验,证明所提出的 GiFlow 模型在不同的缺失模式和缺失率下都能达到有竞争力或更优的性能,优于最先进的基线方法。

## 2 预备知识

### 2.1 符号与问题定义

**符号。** 我们使用花体字母如 \(\mathcal{X}\) 表示集合,大写粗体字母如 \(\mathbf{X}\) 表示矩阵,小写粗体字母如 \(\mathbf{x}\) 表示向量,小写字母如 \(x\) 表示标量。我们用 \(X_{ij}\) 表示 \(\mathbf{X}\) 中第 \(i\) 行第 \(j\) 列的元素。\(\mathbf{1}\) 表示全一矩阵。我们用 \(|x|\)、\(\|\mathbf{x}\|\) 和 \(\|\mathbf{X}\|\) 分别表示 \(x\) 的绝对值、\(\mathbf{x}\) 的 \(\ell_2\) 范数和 \(\mathbf{X}\) 的 Frobenius 范数。\(\mathrm{vec}(\cdot)\) 是矩阵的向量化操作。\(\mathrm{diag}(\mathbf{x})\) 表示以向量 \(\mathbf{x}\) 为对角元素的对角矩阵。\(\circ\) 表示矩阵间的逐元素乘法,\(\oplus\) 表示矩阵间的 Kronecker 和算子。

**图与信号。** 将时空数据表示为一个矩阵 \(\mathbf{X} \in \mathbb{R}^{N \times R}\),其中 \(\mathbf{X}\) 的第 \(r\) 列表示时间 \(r\) 时在 \(N\) 个节点(例如交通传感器或空气质量监测站)上观测到的信号。我们记 \(\mathcal{R} = \{1, \ldots, R\}\) 为时间步集合。节点之间的关系由图 \(\mathcal{G} = (\mathcal{N}, \mathcal{E})\) 表示,其中 \(\mathcal{N}\) 是节点集合,\(\mathcal{E}\) 是边集合。设 \(\mathbf{A} \in \mathbb{R}^{N \times N}\) 为邻接矩阵,\(\mathbf{D} = \mathrm{diag}(\mathbf{A}\mathbf{1})\) 为度矩阵,\(\mathbf{L} = \mathbf{D} - \mathbf{A}\) 为拉普拉斯矩阵。为简化起见,我们专注于一维信号,但该方法可推广到多维信号。

**时空插补。** 我们考虑 \(\mathbf{X}\) 中某些条目缺失的场景。定义一个二元掩码矩阵 \(\mathbf{M} \in \{0,1\}^{N \times R}\),若节点 \(i\) 在时间 \(r\) 的数据被观测到,则 \(M_{ir}=1\),否则为 0。不完整的观测数据由 \(\mathbf{X} \circ \mathbf{M}\) 给出。时空插补的任务是基于不完整观测值,利用节点间的空间依赖性和时间步间的时间依赖性来估计缺失条目。

### 2.2 条件流匹配

流匹配学习一个向量场,将样本从源分布传输到目标分布(Albergo & Vanden-Eijnden,2023 (https://arxiv.org/html/2606.06682#bib.bib1);Lipman 等人,2023 (https://arxiv.org/html/2606.06682#bib.bib26);Liu 等人,2023b (https://arxiv.org/html/2606.06682#bib.bib29))。设 \(\phi_t: [0,1] \times \mathbb{R}^d \to \mathbb{R}^d\) 表示一个依赖于步骤的流映射,其中 \(t\) 是流步骤,通过常微分方程 (ODE) 将 \(\mathbf{x}_0 \sim p_0\) 演化为 \(\mathbf{x}_1 \sim p_1\):

\[
d\phi_t(\mathbf{x}) = u_t(\phi_t(\mathbf{x}))dt, \quad \phi_0(\mathbf{x}) = \mathbf{x}_0,
\]
(1)

其中 \(u_t: [0,1] \times \mathbb{R}^d \to \mathbb{R}^d\) 是一个依赖于步骤的向量场。这通过推前算子 \(p_t = [\phi_t]_* p_0\) 引出一个依赖于步骤的概率密度路径 \(p_t\)(Lipman 等人,2023 (https://arxiv.org/html/2606.06682#bib.bib26))。

流匹配目标旨在寻找一个可训练的向量场 \(v_t(\cdot; \bm{\theta})\) 来近似 \(u_t\):

\[
\mathcal{L}_{\mathsf{FM}}(\bm{\theta}) = \mathbb{E}_{t \sim \mathcal{U}[0,1], \mathbf{x} \sim p_t} \left[ \| v_t(\mathbf{x}; \bm{\theta}) - u_t(\mathbf{x}) \|^2 \right].
\]
(2)

该目标允许从 \(p_0\) 的一个样本出发对 \(p_1\) 进行采样,并建模连续的样本动态。然而,这通常是难以处理的,因为 \(p_t\) 和 \(u_t\) 都是未知的。

条件流匹配 (CFM)(Lipman 等人,2023 (https://arxiv.org/html/2606.06682#bib.bib26))提供了一个可处理的替代方案,通过近似一个条件向量场 \(u_t(\mathbf{x} \mid \mathbf{z})\):

\[
\mathcal{L}_{\text{CFM}}(\bm{\theta}) = \mathbb{E}_{t \sim \mathcal{U}[0,1], \mathbf{z} \sim q(z), \mathbf{x} \sim p_t(\mathbf{x}|\mathbf{z})} \left[ \| v_t(\mathbf{x}; \bm{\theta}) - u_t(\mathbf{x}|\mathbf{z}) \|^2 \right].
\]
(3)

这里,\(\mathbf{z}\) 的选择使得 \(p_t(\mathbf{x} \mid \mathbf{z})\) 的边际分布与边界分布 \(p_0\) 和 \(p_1\) 匹配。通常,\(\mathbf{z} = (\mathbf{x}_0, \mathbf{x}_1)\) 从联合分布 \(q(\mathbf{z}) = \pi(\mathbf{x}_0, \mathbf{x}_1)\) 中采样,其边际为 \(p_0\) 和 \(p_1\)。重要的是,\(\mathcal{L}_{\mathsf{CFM}}\) 和 \(\mathcal{L}_{\mathsf{FM}}\) 在关于 \(\bm{\theta}\) 的梯度一致的意义上是等价的(Lipman 等人,2023 (https://arxiv.org/html/2606.06682#bib.bib26))。

关于时空插补和流匹配的更多讨论见附录 A (https://arxiv.org/html/2606.06682#A1)。

参见图注
图 1:GiFlow 与 FM-Gauss(带高斯先验的 FM 模型)的示意图比较。红色和蓝色虚线分别表示用于生成 GiFlow 和 FM-Gauss 先验的信息。GiFlow 通过自适应时空滤波可观测信号构建图引导先验,使源分布更接近目标分布,从而简化生成轨迹(下半部分)。相比之下,由于与问题无关的高斯先验忽略了时空结构,与目标分布差异显著,因此模型必须遍历更长的路径才能到达目标分布(上半部分)。

## 3 图引导流匹配

在本节中,我们首先通过自适应时空滤波构建一个图引导先验,然后介绍用于时空插补的 GiFlow 框架,并对其有效性进行理论论证。GiFlow 框架的示意图概览见图 1 (https://arxiv.org/html/2606.06682#S2.F1)。

### 3.1 通过自适应时空滤波构建图引导先验

设 \(\mathbf{X}_1^M = \mathbf{X}_1 \circ \mathbf{M}\) 表示可观测的时空信号。GiFlow 的目标是通过生成模型 \(p_{\bm{\theta}}(\mathbf{X}_1 \mid \mathbf{X}_1^M)\) 建模条件分布 \(p_1(\mathbf{X}_1 \mid \mathbf{X}_1^M)\)。通常,生成模型从各向同性高斯分布出发,并将 \(\mathbf{X}_1^M\) 作为条件变量(Liu 等人,2023a (https://arxiv.org/html/2606.06682#bib.bib27);He 等人,2025 (https://arxiv.org/html/2606.06682#bib.bib21))。然而,依赖这种简单先验会使生成过程复杂化,因为先验分布与目标分布差异显著(Kollovieh 等人,2025 (https://arxiv.org/html/2606.06682#bib.bib24))。为了构建更具结构性的先验,我们可以将条件分布分解为:

\[
p_{\bm{\theta}}(\mathbf{X}_1 \mid \mathbf{X}_1^M) = \int p_{\bm{\theta}}(\mathbf{X}_1 \mid \mathbf{X}_0, \mathbf{X}_1^M) q_0(\mathbf{X}_0 \mid \mathbf{X}_1^M) \, d\mathbf{X}_0.
\]

将 \(q_0\) 设为与问题无关的标准高斯分布(如现有扩散和 FM 模型所做的那样)忽略了时空结构。利用 FM 的灵活性,我们构建一个更接近目标数据分布 \(p_1\) 的图引导先验。通过促进这种对齐,我们旨在降低总传输成本。

我们利用联合连续时空滤波来构建图引导先验。

相似文章

SDFlow:用于时间序列生成的相似性驱动流匹配

arXiv cs.AI

本文介绍了 SDFlow,这是一种用于时间序列生成的相似性驱动流匹配框架,旨在解决自回归模型中的暴露偏差问题。通过在冻结的 VQ 潜在空间中进行低秩流形分解,SDFlow 实现了最先进的性能并显著提升了推理速度。

几何感知的图像流匹配

Hugging Face Daily Papers

本文提出用于自然图像的几何感知流匹配方法,将图像视为超球面上的点,并提出了SOT-CFM和SFM方法,通过利用图像数据的球面结构来改进生成建模。

Recursive Flow Matching

Hugging Face Daily Papers

引入了 Recursive Flow Matching (RecFM),一种用于预测复杂时空动态的生成框架,以更少的步骤实现高保真度,并提高了准确性和速度,包括相比基于扩散的模拟器高达20倍的加速。

WarmPrior: 利用时间先验拉直流匹配策略

arXiv cs.LG

介绍了WarmPrior,该方法将流匹配策略中的标准高斯源替换为来自近期动作历史的时间约束先验,通过生成更直的路径概率,持续提升机器人操控任务的成功率。