MVG-KAN：多视图地理风引导KAN用于PM$_{2.5}$预测

arXiv cs.AI 2026/06/24 04:00 论文

pm2-5-forecasting kan spatio-temporal air-quality deep-learning graph-neural-network environmental-modeling

摘要

本文提出MVG-KAN，一种集成周期-残差分解、用于风感知空间依赖性的地理风图以及用于PM2.5预测的时间KAN头的多视图模型，在北京数据上实现MAE 14.09。

arXiv:2606.24347v1 公告类型：新摘要：准确的短期PM$_{2.5}$预测对于公共卫生保护、空气质量预警和城市环境管理非常重要。然而，PM$_{2.5}$的变化受多种耦合因素驱动，包括人类活动和气象规律引起的稳定周期性变化、站点特定的短期浓度演变，以及气象驱动的监测站点间污染物扩散。现有的时空预测方法可以在一定程度上捕获站点关系，但仅基于距离、相关性或纯粹自适应的图通常不足以全面表示这些异质因素，尤其是依赖于风向的污染物传输。为了解决这个问题，我们提出了一种用于PM$_{2.5}$预测的多视图地理风引导KAN模型，命名为\textbf{MVG-KAN}，该模型从三个互补的视图对站点级PM$_{2.5}$演变进行建模：局部周期性规律、站点残差时间动态和气象环境引导的空间扩散。具体来说，周期-残差预测主干首先将稳定的日和周模式与非周期性残差变化分离。通过结合地理距离衰减与感知风向和风速的传输，构建了地理风图，为站点间的残差传播提供了一个轻量级、物理驱动的有向空间先验。此外，引入了时间Kolmogorov-Arnold网络（TKAN）残差头，以从去周期化的PM$_{2.5}$残差和历史多污染物序列中学习站点级的非线性自回归校正，从而增强对局部残差惯性和污染物共变性的建模。

查看原文

查看缓存全文

缓存时间: 2026/06/24 07:46

# MVG-KAN：多视图地理-风引导KAN用于PM2.5预测
来源：https://arxiv.org/html/2606.24347
Cheng Huang、Muyao Guan、Jairus Yougui Railey、Ning Xu、Honghui Xu、Changjiang Zhang、Zhen Zhang、Shiqing Zhang 和 Cong BaiCheng Huang、Muyao Guan、Jairus Yougui Railey、Ning Xu、Honghui Xu、Changjiang Zhang、Zhen Zhang、Shiqing Zhang 均任职于台州学院人工智能学院，中国台州 318000。Cong Bai 任职于浙江工业大学计算机科学与技术学院，中国杭州 310023。通讯作者：Zhen Zhang 和 Shiqing Zhang（电子邮箱：[email protected]；[email protected]）。

###### 摘要

准确的短期PM2.5预测对于公众健康保护、空气质量预警和城市环境管理至关重要。然而，PM2.5变化受多种耦合因素驱动，包括人类活动和气象规律引起的稳定周期性变化、站点特定的短期浓度演变，以及气象驱动的监测站点间污染物扩散。现有的时空预测方法可能在一定程度上捕捉站点关系，但仅基于距离、相关性或纯自适应图的表示往往不足以全面涵盖这些异质性因素，尤其是风向依赖的污染物输送。为解决此问题，我们提出了一种用于PM2.5预测的多视图地理-风引导KAN模型，命名为MVG-KAN，该模型从三个互补视角对站点级PM2.5演变进行建模：局部周期性规律、站点残余时间动态和气象环境引导的空间扩散。具体而言，周期-残差预测主干首先将稳定的日/周模式与非周期性残差变化分离。通过结合地理距离衰减和风向、风速感知的输送，构建了地理-风图，为站点间残差传播提供了一种轻量级的、基于物理的有向空间先验。此外，引入了一个时间Kolmogorov-Arnold网络（TKAN）残差头，用于从去周期化后的PM2.5残差和历史上多种污染物序列中学习站点非线性的自回归修正，从而增强对局部残差惯性和污染物协变的建模。在北京PM2.5数据集上的实验表明，MVG-KAN达到了14.09的MAE和21.40的RMSE。消融研究进一步验证了TKAN和地理-风图的互补效应，表明多视图建模对于站点级PM2.5预测是有效的。

## I引言

空气动力学直径小于2.5µm的细颗粒物，即PM2.5，是最有害的城市空气污染物之一。高浓度的PM2.5与呼吸系统和心血管疾病、大气能见度降低以及城市环境质量恶化密切相关[22 (https://arxiv.org/html/2606.24347#bib.bib16),4 (https://arxiv.org/html/2606.24347#bib.bib20),12 (https://arxiv.org/html/2606.24347#bib.bib17),14 (https://arxiv.org/html/2606.24347#bib.bib21)]。因此，准确的PM2.5预测对于公众健康保护、空气质量预警、暴露风险评估和城市环境管理至关重要[38 (https://arxiv.org/html/2606.24347#bib.bib18),1 (https://arxiv.org/html/2606.24347#bib.bib19)]。对未来几小时或几天的可靠预测可以支持公众建议、临时排放控制计划、交通和工业监管以及在重污染期间的应急响应。

参照图说明图 1：MVG-KAN用于PM2.5预测的动机。目标站点Si的PM2.5演变被建模为局部周期模式Pi(t)、局部残差动态Ri(t)和风驱动空间传输Ti(t)的多视图。周期分量描述规律的日/周变化，残差分量表示局部非周期波动和污染事件，传输分量捕捉风场作用下从逆风/源站点到Si的定向污染物传播。这种分解促使所提出的框架联合建模时间规律性、站点级残差修正和物理信息引导的地理-风空间传输，而不是仅依赖时间历史或通用距离/相关/自适应图。为了实现准确的PM2.5预测，过去几十年中已经开发了多种方法。早期研究主要依赖于传统的统计方法，例如自回归积分滑动平均模型（ARIMA）、回归模型和其他时间序列预测技术[3 (https://arxiv.org/html/2606.24347#bib.bib3)]。这些方法计算效率高，且具有较好的可解释性，使其适用于捕捉简单的时间趋势和周期性波动。然而，它们通常依赖于线性假设和手工特征工程，这限制了它们建模污染物、气象变量和排放源之间高度非线性和复杂相互作用的能力[40 (https://arxiv.org/html/2606.24347#bib.bib23),15 (https://arxiv.org/html/2606.24347#bib.bib22),24 (https://arxiv.org/html/2606.24347#bib.bib4)]。由于PM2.5的形成和演变涉及复杂的非线性过程，传统统计方法在快速变化的环境条件下往往难以保持预测准确性[1 (https://arxiv.org/html/2606.24347#bib.bib19)]。

为了克服这些局限性，深度学习方法越来越多地被用于PM2.5预测。诸如循环神经网络（RNNs）[8 (https://arxiv.org/html/2606.24347#bib.bib2)]、长短期记忆网络（LSTMs）[11 (https://arxiv.org/html/2606.24347#bib.bib25)]、门控循环单元（GRUs）[6 (https://arxiv.org/html/2606.24347#bib.bib26)]、时间卷积网络（TCNs）[2 (https://arxiv.org/html/2606.24347#bib.bib27)]以及基于Transformer的架构等模型，在从历史观测中直接学习非线性时间依赖关系方面展现出了强大的能力[18 (https://arxiv.org/html/2606.24347#bib.bib39),41 (https://arxiv.org/html/2606.24347#bib.bib28),20 (https://arxiv.org/html/2606.24347#bib.bib29),19 (https://arxiv.org/html/2606.24347#bib.bib1)]。通过利用大规模监测数据，这些方法可以在无需对底层数据分布进行显式假设的情况下自动提取复杂的时间模式。然而，大多数早期的深度学习方法主要关注单个站点的时间建模，往往忽略了监测位置之间的空间相互作用。由于大气过程可以使空气污染物跨区域输送，忽略空间依赖性可能导致对PM2.5动态的不完整表示。

为了解决这个问题，提出了时空预测模型来联合建模时间演变和空间相互作用[17 (https://arxiv.org/html/2606.24347#bib.bib24),35 (https://arxiv.org/html/2606.24347#bib.bib5),23 (https://arxiv.org/html/2606.24347#bib.bib6),39 (https://arxiv.org/html/2606.24347#bib.bib43)]。这些方法将时间神经网络与空间模块相结合，以捕捉监测站点之间的相关性，从而在区域空气质量预测任务中提高预测性能。与纯时间模型相比，时空方法可以更好地表征污染物传播和区域协变模式。然而，许多现有的时空方法使用预定义的网格或通用空间算子来表示空间关系，这可能无法充分描述监测站点的不规则分布以及它们之间的异质性相互作用。因此，它们模拟真实的站点间依赖关系的能力仍然有限。

基于图的方法为这一挑战提供了自然的解决方案，它将监测站点表示为图节点，将站点关系表示为图边。图神经网络（GNNs）[13 (https://arxiv.org/html/2606.24347#bib.bib31),27 (https://arxiv.org/html/2606.24347#bib.bib32)]和时空图神经网络（STGNNs）[23 (https://arxiv.org/html/2606.24347#bib.bib6)]在空气质量预测中取得了显著成功，因为它们可以灵活地建模不规则的空间结构并学习站点之间的复杂依赖关系[16 (https://arxiv.org/html/2606.24347#bib.bib33),36 (https://arxiv.org/html/2606.24347#bib.bib34),28 (https://arxiv.org/html/2606.24347#bib.bib7),32 (https://arxiv.org/html/2606.24347#bib.bib40)]。现有的图构建策略通常依赖于地理距离、统计相关性、自适应图学习或其组合。这些方法有效地捕捉了空间关系的某些方面，并显著提升了PM2.5的预测性能。

尽管取得了这些进展，现有的基于图的PM2.5预测方法仍然表现出一些局限性。首先，许多方法主要侧重于学习空间依赖关系，而对PM2.5演变内在的周期规律性关注不足[30 (https://arxiv.org/html/2606.24347#bib.bib38),37 (https://arxiv.org/html/2606.24347#bib.bib41),25 (https://arxiv.org/html/2606.24347#bib.bib42)]。在实践中，人类活动、交通强度、工业生产和气象条件通常遵循日和周的循环，导致PM2.5浓度呈现稳定的周期性模式。显式建模这种周期规律性可以提供强大的预测信号并提高预测的鲁棒性。

其次，在移除周期性模式后，剩余的PM2.5残差不应该被视为随机模式。这些残差通常包含站点特定的时间动态，这些动态源于污染物积累、缓慢消散、局部排放、突变的环境变化以及多种污染物之间的相互作用。现有的基于图的方法通常强调全局的时空表示，但可能未能充分利用嵌入在站点级残差序列中的非线性自回归特征。

第三，污染物输送从根本上受气象条件影响，尤其是风场。上游站点排放的污染物可能会显著影响下游位置，而地理上接近的站点如果不与盛行风向对齐，其影响可能有限。然而，许多现有的图构建策略仅依赖地理距离、历史相关性或自适应学习机制。此类图可能捕捉到统计依赖性，但往往缺乏关于气象驱动污染物扩散的显式物理指导[34 (https://arxiv.org/html/2606.24347#bib.bib8),42 (https://arxiv.org/html/2606.24347#bib.bib9),33 (https://arxiv.org/html/2606.24347#bib.bib10)]。

如图1 (https://arxiv.org/html/2606.24347#S1.F1)所示，这些观察表明，准确的PM2.5预测应同时考虑三个互补的视角：周期性规律、站点特定的残差动态和气象驱动的空间传输。从这个角度来看，站点i的PM2.5浓度演变可以概念性地表示为

PM2.5i(t) = Pi(t) + Ri(t) + Ti(t), (1)
其中Pi(t)表示局部周期分量，Ri(t)表示站点级的残差时间分量，Ti(t)表示气象驱动的传输分量。这个公式并非旨在成为大气过程的严格物理分解。相反，它提供了一个面向预测的多视图视角，突出了PM2.5演变中三个主要的可预测性来源。

周期分量捕捉由重复的人类活动和环境循环引起的稳定时间规律性。残差分量捕捉在去除周期性后仍然可预测的局部非线性动态。传输分量捕捉由变化的气象条件下污染物扩散引起的站点间影响。这三个视角是互补的，而非冗余的。忽略其中任何一个都可能导致对PM2.5动态理解不完整，从而限制预测性能。

受此观察启发，我们提出了MVG-KAN，一个用于PM2.5预测的多视图地理-风引导KAN框架。所提出的框架明确地从上述三个角度对PM2.5演变进行建模。具体来说，我们采用周期-残差预测范式[25 (https://arxiv.org/html/2606.24347#bib.bib42)]作为主干，将稳定的周期性模式与非周期性变化分离开。在此基础之上，我们首先开发了一个地理-风图（Geo-Wind Graph），通过将地理距离衰减、风向和风速整合到一个统一的有向图结构中，来模拟气象驱动的污染物扩散。与传统的基于距离或相关性的图不同，所提出的地理-风图显式地融入了物理上有意义的传输信息，使模型能够区分上风和下风关系，并更好地表征监测站点之间的污染物传播。

此外，我们引入了一个时间Kolmogorov-Arnold网络（TKAN）残差头来建模站点级的非线性残差动态。TKAN不是直接从原始PM2.5序列中学习，而是对去周期化后的残差以及历史上的多污染物观测数据进行操作，使其能够专注于局部残差惯性、突变和污染物协变模式。

周期-残差主干、地理-风图空间建模和TKAN残差时间建模共同实现了所提出的多视图预测视角。周期分支捕捉稳定规律性，地理-风图捕捉气象引导的空间传输，而TKAN捕捉站点特定的残差演变。与仅关注预测问题的一个或两个方面的现有方法相比，它们共同提供了对PM2.5动态更全面的表示。

本文的主要贡献总结如下：

1.  针对现有方法对PM2.5演变机制分解不足的问题，我们提出了多视图地理-风引导KAN框架（MVG-KAN），该框架联合建模局部周期性规律、站点级残差时间动态以及气象驱动的空间扩散。
2.  为了克服仅基于距离、相关性或纯自适应空间图的局限性，我们开发了地理-风图，该图集成了地理距离衰减、风向和风速，用于定向污染物扩散建模。
3.  为了更好地捕捉移除稳定周期模式后的非周期性局部波动，我们引入了TKAN残差头，它从去周期化的PM2.5残差和历史上多种污染物序列中学习非线性自回归修正。
4.  在北京PM2.5数据集上的大量实验证明了MVG-KAN的有效性。所提出的模型实现了14.09的MAE和21.40的RMSE，在比较的深度学习方法中获得了最佳的平均MAE和RMSE。进一步的消融研究验证了TKAN和地理-风图的互补作用，其中TKAN改善了局

MVG-KAN：多视图地理风引导KAN用于PM$_{2.5}$预测

相似文章

用于交通预测的图条件图神经网络专家混合模型

Kwai Keye-VL-2.0 技术报告

TelcoAgent：可扩展的5G多KPM预测与基于3GPP的可解释性

几何科爾莫戈羅夫-阿諾德網絡 (GeoKAN)

SynopticBench：评估视觉语言模型生成未来天气预报讨论的能力

提交意见反馈