嵌套时空时间序列预测

arXiv cs.LG 论文

摘要

本文提出一种嵌套时空预测框架,利用谱聚类构建语义一致的宏观区域,为细粒度的微观预测提供自上而下的指导。在高维数据集上的实验表明,该方法始终优于最先进的基线模型。

arXiv:2605.16447v1 公告类型:新 摘要:时空预测对于交通管理等实际应用至关重要,但在噪声和非平稳条件下捕捉可靠交互仍然具有挑战性。现有方法主要依赖于历史空间先验,常常无法考虑不断变化的时间相关性,并且存在系统误差。在这项工作中,我们提出一种嵌套预测框架,将未来的宏观区域趋势与微观历史观测相结合,实现从抽象未来表征到细粒度预测的自上而下引导。具体而言,我们采用基于谱聚类的方法构建语义连贯的区域,并提供理论和实证证据表明该表示能够有效过滤系统噪声同时保留基本趋势。在此基础上,我们开发了一个渐进式的粗到精预测器,将这些代表性特征整合到推理过程中。这使得模型能够利用趋势预测提前预判动态异常,例如周期性偏移。此外,在多个高维数据集上的大量实验表明,我们的方法始终优于最先进的基线模型,验证了未来宏观引导的嵌套预测的有效性。
查看原文
查看缓存全文

缓存时间: 2026/05/19 06:43

# 嵌套时空时间序列预测  
来源:https://arxiv.org/html/2605.16447  

Yukai Zhou∗⋄ Ruoxi Jiang† Junyi An† Chao Qu† Zhijian Zhou Shiyu Wang Fenglei Cao Zenglin Xu† Furao Shen† Yuan Qi†  

###### 摘要  

时空预测对于交通管理等实际应用至关重要,但在噪声和非平稳条件下捕捉可靠的交互仍然具有挑战性。现有方法主要依赖于历史空间先验,往往未能考虑随时间演化的时间相关性,并且存在系统性误差。在这项工作中,我们提出了一种嵌套预测框架,将未来的宏观区域趋势与微观历史观测相耦合,从而实现从抽象未来表示到细粒度预测的顶层指导。具体而言,我们采用基于谱聚类的方法构建语义一致的区域,并提供理论和实验证据表明,这种表示能够有效过滤系统性噪声,同时保留关键趋势。在此基础上,我们开发了一个渐进式的从粗到细的预测器,将这些代表性特征集成到推理过程中。这使得模型能够利用趋势预测提前预判动态异常(如周期性偏移)。此外,在多个高维数据集上的广泛实验表明,我们的方法一致地优于最先进的基线,验证了未来宏观引导的嵌套预测的有效性。  

时空预测,图神经网络,ICML  

## 1 引言  

时空预测(STF)在现代智能系统中扮演着关键角色,支持从城市交通管理到极端天气预测等多种应用(Jin et al.,2024 (https://arxiv.org/html/2605.16447#bib.bib89);Kumar et al.,2025 (https://arxiv.org/html/2605.16447#bib.bib67);Wang et al.,2025b (https://arxiv.org/html/2605.16447#bib.bib79);Chen et al.,2025 (https://arxiv.org/html/2605.16447#bib.bib84);Wang et al.,2025a (https://arxiv.org/html/2605.16447#bib.bib85))。在这些领域中,准确的预测对于主动决策至关重要,例如早期拥堵控制(Hamedmoghadam et al.,2022 (https://arxiv.org/html/2605.16447#bib.bib46))和应急规划(Guo et al.,2023 (https://arxiv.org/html/2605.16447#bib.bib44))。然而,在延长的时间范围上实现鲁棒的预测仍然是一个重大挑战,这主要是由于现实世界系统中固有的复杂空间交互和动态时间模式(Lan et al.,2022 (https://arxiv.org/html/2605.16447#bib.bib31);Chen et al.,2024 (https://arxiv.org/html/2605.16447#bib.bib83);He et al.,2025 (https://arxiv.org/html/2605.16447#bib.bib32);Gao et al.,2025 (https://arxiv.org/html/2605.16447#bib.bib78))。作为多变量时间序列(MTS)预测中的一项专门任务,STF侧重于通过有效建模空间相关性来提高预测精度(Shao et al.,2025 (https://arxiv.org/html/2605.16447#bib.bib23))。早期方法(Li et al.,2018 (https://arxiv.org/html/2605.16447#bib.bib29);Yu et al.,2018 (https://arxiv.org/html/2605.16447#bib.bib69))通常将先验拓扑结构直接集成到基于图的 learner 中;然而,这些先验往往需要专家知识,并且可能忽略动态特征空间中的复杂模式。为了更好地与动态数据的归纳偏差对齐,后续方法(Wu et al.,2019 (https://arxiv.org/html/2605.16447#bib.bib34),2020b (https://arxiv.org/html/2605.16447#bib.bib57))引入了可学习的邻接矩阵,以使用图神经网络自适应地捕捉潜在边。其他研究(Shao et al.,2022a (https://arxiv.org/html/2605.16447#bib.bib58);Jiang et al.,2023a (https://arxiv.org/html/2605.16447#bib.bib60);Diao et al.,2024 (https://arxiv.org/html/2605.16447#bib.bib30);Ma et al.,2025b (https://arxiv.org/html/2605.16447#bib.bib77))将此扩展到时间维度,采用时变和多视图图来建模演化中的交互。尽管有这些架构上的进步,现有框架仍面临一个关键限制:当前方法中广泛使用的细粒度全图建模极易受到系统噪声的影响,这随着空间尺度的增长而变得尤为严重。在这个扩展的搜索空间中,模型倾向于学习虚假相关性(Zhao et al.,2023 (https://arxiv.org/html/2605.16447#bib.bib25)),最终损害所学表示的鲁棒性。为了减轻结构不确定性的影响并实现鲁棒的预测,我们研究了宏观层面表示的效用。构建此类表示的标准做法涉及空间聚合或切分;然而,现有文献(Ma et al.,2023 (https://arxiv.org/html/2605.16447#bib.bib36);Zhang et al.,2024 (https://arxiv.org/html/2605.16447#bib.bib19);Fang et al.,2025 (https://arxiv.org/html/2605.16447#bib.bib59))主要将这些粗粒度信号视为辅助输入,以提供鲁棒的历史统计数据。在这项工作中,我们旨在探索一种更有前景的范式:利用粗粒度表示来刻画未来状态,从而作为预测过程中稳定的结构指导。这种方法引入了一个重大挑战:如何提取具有高表示保真度的粗粒度信号,同时保持与其细粒度对应物之间的拓扑和语义对齐。受这些见解的启发,我们提出了 NeST(Nested Spatio-Temporal forecasting),这是一种时空预测框架,通过具有未来意识的宏观指导设计,超越了微观层面的建模。NeST 通过两个核心阶段实现了历史细粒度和未来粗粒度动态的跨时间范围建模。首先,为了从局部观测中提取代表性的宏观动态,我们采用语义谱聚类(Ng et al.,2001 (https://arxiv.org/html/2605.16447#bib.bib99)),该聚类直接在原始特征序列构建的亲和矩阵上操作,适应动态语义相关性而不依赖静态物理先验,同时产生一个紧凑的表示空间。其次,为了实现时间预测中有效的多尺度交互,我们引入了一种对称注意力机制,该机制促进跨时空尺度的双向信息流。特别地,宏观状态被预测到未来多个时间步,提供抽象的上下文,从而正则化细粒度预测。关键的是,宏观状态表示的低秩性显著降低了计算成本,同时保留了趋势层面的表现力。我们的贡献总结如下:  

- • 我们提出了 NeST,一种嵌套时空预测框架,引入了宏观引导的跨时间范围建模,使用预测的区域级未来作为显式的顶层指导,来正则化和增强细粒度预测。  
- • 我们设计了一种计算高效的多尺度架构,利用语义谱聚类捕捉动态代表性特征,实现鲁棒对齐,同时更好地保留系统性趋势。  
- • 我们通过在多个大规模数据集上的广泛实验验证了 NeST 的有效性,在多种指标上一致优于最先进的方法。  

## 2 相关工作  

**时空预测。** 时空预测的核心目标是通过捕捉历史观测中存在的复杂依赖关系来预测系统的未来状态。早期工作将循环或时间卷积模块与使用固定拓扑的图编码器相结合,以建模空间相关性(Li et al.,2018 (https://arxiv.org/html/2605.16447#bib.bib29);Yu et al.,2018 (https://arxiv.org/html/2605.16447#bib.bib69))。为了放松对预定义结构的依赖,后来的方法如 GWNET、MTGNN 和 AGCRN 引入了自适应嵌入,直接从观测中推断潜在的时空依赖(Wu et al.,2019 (https://arxiv.org/html/2605.16447#bib.bib34),2020b (https://arxiv.org/html/2605.16447#bib.bib57);Bai et al.,2020 (https://arxiv.org/html/2605.16447#bib.bib18))。尽管这些数据驱动方法通过学习数据中的空间关系放松了对预定义图的依赖,但推断出的关系结构通常在推理过程中是静态的。因此,它们仍然难以捕捉随时间演化的空间依赖关系,而这在复杂的现实世界系统中很常见(Han et al.,2021 (https://arxiv.org/html/2605.16447#bib.bib80))。为了捕捉时变连接性,最近的一系列工作利用注意力和动态消息传递机制,随时间自适应地调整关系;代表性例子包括 DSTAGNN、MegaCRN 和 STAEFormer 等(Lan et al.,2022 (https://arxiv.org/html/2605.16447#bib.bib31);Jiang et al.,2023b (https://arxiv.org/html/2605.16447#bib.bib56);Liu et al.,2023a (https://arxiv.org/html/2605.16447#bib.bib65);Xie et al.,2023 (https://arxiv.org/html/2605.16447#bib.bib81);Kong et al.,2024 (https://arxiv.org/html/2605.16447#bib.bib61);Gong et al.,2024 (https://arxiv.org/html/2605.16447#bib.bib86);Li et al.,2025 (https://arxiv.org/html/2605.16447#bib.bib17))。这些方法使模型能够跟踪变化的依赖关系,并更好地处理非平稳的时空动态(Lyu et al.,2025 (https://arxiv.org/html/2605.16447#bib.bib82))。基于这些动态能力,最近的研究进一步针对系统性挑战,如空间异质性(Ji et al.,2023 (https://arxiv.org/html/2605.16447#bib.bib75);Dong et al.,2024 (https://arxiv.org/html/2605.16447#bib.bib37))和大规模网络的可扩展性(Yuan et al.,2024 (https://arxiv.org/html/2605.16447#bib.bib91);Fang et al.,2025 (https://arxiv.org/html/2605.16447#bib.bib59))。尽管取得了这些进展,大多数现有架构仍然专注于微观尺度建模,对噪声和短期不规则性保持敏感。  

**层次时空建模。** 层次结构有助于捕捉多尺度的时空动态(Mao et al.,2025 (https://arxiv.org/html/2605.16447#bib.bib1))。早期工作如 HGCN 和 HRNR 将传感器分组为静态区域,以总结宏观尺度模式(Guo et al.,2021 (https://arxiv.org/html/2605.16447#bib.bib35);Wu et al.,2020a (https://arxiv.org/html/2605.16447#bib.bib39)),后来的扩展(例如 HSDGNN)建模了更复杂的结构依赖关系(Zhou et al.,2025 (https://arxiv.org/html/2605.16447#bib.bib96))。最近的方法引入了灵活的跨尺度交互:HiSTGNN、HIEST 和 AIMST 提出了在传感器级别和区域级别表示之间交换信息的动态机制,而 HSTAN 和 HSFE 应用多级注意力和特征融合来整合全局和局部相关性(Ma et al.,2022 (https://arxiv.org/html/2605.16447#bib.bib38),2023 (https://arxiv.org/html/2605.16447#bib.bib36);Zhang et al.,2024 (https://arxiv.org/html/2605.16447#bib.bib19);Marisca et al.,2024 (https://arxiv.org/html/2605.16447#bib.bib13))。除了空间层次,一些工作还探索了时间多尺度建模(Challu et al.,2023 (https://arxiv.org/html/2605.16447#bib.bib10);Wang et al.,2023 (https://arxiv.org/html/2605.16447#bib.bib12);Chen et al.,2023 (https://arxiv.org/html/2605.16447#bib.bib53);Wang et al.,2024a (https://arxiv.org/html/2605.16447#bib.bib88))。然而,大多数先前的方法将层次结构主要视为历史表示的机制。它们通常采用单阶段投影,直接将过去的观测映射,迫使模型从噪声数据中隐式推断演化趋势,使得预测极易受到输入扰动的影响。另一方面,关于神经算子的近期工作(Jiang et al.,2025 (https://arxiv.org/html/2605.16447#bib.bib41))表明,融合未来信息可以提高长期稳定性和物理一致性。然而,其公式假设了规则的时空网格,不适用于具有缺失值和高噪声的不规则图结构数据。在这项工作中,NeST 建立了一个层次预测范式,显式预测未来的宏观状态作为结构指导。通过利用代表性的未来动态来指导细粒度生成,NeST 稳定了预测过程,并缓解了单阶段预测的局限性。  

参考图注  

图1:NeST 示意图。 (i) 谱表示:通过谱聚类对节点级时间序列进行划分,得到代表性的区域动态 \(\mathbf{Z}\),作为系统的宏观结构锚点。 (ii) 训练阶段:我们使用解耦的编码器处理历史节点信号 \(\mathbf{X}_{t-L+1:t}\) 以及未来的区域指导 \(\mathbf{Z}_{t+1:t+P}\)。为了弥合训练和推理之间的差距,我们采用计划采样策略:以概率 \(P_{\rm tf}\) 通过教师强制提供真实区域特征,而以概率 \(1-P_{\rm tf}\) 使用预测的滚动输出 \(\hat{\mathbf{Z}}_{t+1:t+P}\)。通过交叉注意力机制(为简洁起见省略了 MLP)促进尺度之间的双向信息流,这有效地将交互复杂度限制为聚类数量 \(M\)(其中 \(M < N\)),确保未来导向的指导,同时保持相对于节点数量的线性可扩展性。  

## 3 预备知识  

我们考虑一个由 \(N\) 个相关传感器组成的时空系统,在时间 \(t\) 的观测值记为 \(\mathbf{X}_{t} \in \mathbb{R}^{N \times C}\)。我们的目标是给定长度为 \(L\) 的历史上下文 \(\mathbf{X}_{t-L+1:t} \in \mathbb{R}^{N \times L \times C}\),预测长度为 \(H\) 的未来序列。为了在保持计算效率的同时有效建模长程依赖关系,我们将问题表述为基于补丁的自回归预测任务。在每个步骤中,模型根据前 \(L\) 个时间步预测下一个长度为 \(P\) 的未来补丁。在训练期间,模型通过预测补丁 \(\hat{\mathbf{X}}_{t+1:t+P}\) 上的单步监督进行优化。在推理期间,整个范围 \(H\) 是自回归生成的:模型将其自身的预测补丁作为后续迭代的上下文,直到生成整个序列。  

## 4 方法  

在本节中,我们介绍 NeST(Nested Spatio-Temporal)框架。NeST 采用了一种层次化的从粗到细范式,其中细粒度的节点级预测由稳定、宏观的中心动态指导,以减轻局部噪声的影响。  

### 4.1 从原始数据到中心特征  

直接进行节点级预测具有挑战性,原因在于输出空间的高维性,以及局部噪声、缺失值和短期不规则波动。为了解决这个问题,我们利用谱聚类(Ng et al.,2001 (https://arxiv.org/html/2605.16447#bib.bib99);Shi and Malik,2000 (https://arxiv.org/html/2605.16447#bib.bib97))来提取潜在的区域级表示,这些表示作为系统的结构锚点,为细粒度节点级预测提供抽象指导。  

#### 构建时间亲和矩阵  

有效的区域化应反映时间一致性,这意味着分配到同一区域的节点表现出一致的长期共动模式。源自物理邻近性或先验知识的亲和矩阵可能会忽略动态变化。

相似文章

维度平衡提升大规模时空预测性能

arXiv cs.LG

本文提出一个框架,利用基于熵的诊断方法来协调空间和时间特征表示,在涉及城市交通、气象和疫情数据集的大规模时空预测任务中实现了显著的精度提升。

Nexus:面向时间序列预测的智能体框架

Hugging Face Daily Papers

Nexus 提出了一种多智能体框架,将时间序列预测分解为多个专门阶段,利用大语言模型整合数值模式与上下文信息,在基准测试上取得了最先进的结果。