利用时空图神经网络重建GRACE陆地水储量:南美洲应用
摘要
本文提出了一种深度学习的方法,使用时空图神经网络(MTGNN)重建南美洲自1940年以来的GRACE陆地水储量异常,实现了高精度,并且用更少的预测因子优于以往的方法。
arXiv:2606.23833v1 公告类型:新
摘要:陆地水储量(TWS)整合了积雪、土壤水分、地表水和地下水,是反映气候变率和人类活动如何重塑全球水循环的关键指标。GRACE和GRACE-FO卫星任务提供了全球一致且直接的TWS变化观测数据,但其记录始于2002年,对于许多气候尺度分析而言时间跨度过短。我们提出了一种深度学习应用,通过学习每日ERA5气象强迫(降水、蒸散发、径流)与月度GRACE观测之间的关系,将月度GRACE-like TWS异常(TWSA)重建至1940年。与以往基于网格单元回归、CNN或LSTM的重建方法不同,我们采用了多变量时间序列图神经网络(MTGNN)架构——该架构最初用于城市传感器网络上的移动性和交通预测,现将其应用于此卫星大地测量任务。空间依赖性通过一个静态、可解释的混合邻接矩阵编码,该矩阵结合了测地邻近性与气候时间序列的滞后相关性,从而捕捉局部水文耦合和大尺度遥相关。重建结果实现了网格单元皮尔逊相关系数0.69、流域平均相关系数0.94,且偏差接近零,并再现了2015/16年厄尔尼诺和2020/21年拉尼娜事件的空间特征。与现有重建方法(GTWS-MLrec、RM-REC、GRAiCE)的系统比较表明,该图模型在流域尺度上具有统计竞争力,相关性在最佳基线的0.025以内,同时仅需其他模型约二分之一至十分之一的预测因子,并揭示了所有模型在干旱地区的典型缺陷。完整实现代码已在github.com/hcu-cml/MTGNN-TWS-Reconstruction-GRACE公开。
查看缓存全文
缓存时间: 2026/06/24 07:48
# 基于时空图神经网络重建GRACE陆地水储量:南美洲应用案例 [应用类论文]
来源:https://arxiv.org/html/2606.23833
\(2026\)
###### 摘要。
陆地水储量(TWS)综合了积雪、土壤水分、地表水和地下水,是反映气候变化与人类活动如何重塑全球水循环的关键指标。GRACE和GRACE-FO卫星任务提供了唯一直接、全球一致的TWS变化观测,但其记录始于2002年,对许多气候尺度分析而言过于短暂。我们提出一种深度学习应用,通过学习每日ERA5气象强迫(降水、蒸散发、径流)与月度GRACE观测之间的关系,将月尺度的类GRACE TWS异常(TWSA)重建至1940年。与以往基于网格单元回归、CNN或LSTM的重建方法不同,我们改编了多变量时间序列图神经网络(MTGNN)架构——该架构最初是为城市传感器网络上的移动性和交通预测而开发的——以适应这一卫星大地测量任务。空间依赖性被编码在一个静态、可解释的混合邻接矩阵中,该矩阵结合了测地邻近性与气候时间序列的滞后相关性,既捕捉了局部水文耦合,也捕捉了大尺度遥相关。在南美洲针对GRACE/GRACE-FO(2002–2023年)的评估表明,重建结果在网格单元上达到皮尔逊相关系数0.69,流域平均相关系数0.94,偏差接近零,并再现了2015/16年厄尔尼诺和2020/21年拉尼娜事件的空间特征。与现有重建方法(GTWS-MLrec、RM-REC、GRAiCE)的系统比较表明,基于图的模型在流域尺度上统计性能相当(相关系数与最佳基线相差0.025以内),而所需预测变量仅为其他模型的约一半到十分之一,同时揭示了所有模型在干旱区域的共同弱点。我们讨论了在卫星大地测量应用中部署图深度学习的最佳实践与经验教训,并概述了通过增加预测因子和基于陆地水均衡方程的物理约束进行扩展的路径。为支持可重复性和未来研究,完整实现在以下网址公开:https://github.com/hcu-cml/MTGNN-TWS-Reconstruction-GRACE。
陆地水储量,GRACE,图神经网络,时空建模,ERA5,气候重建,地理空间人工智能
††会议:第34届ACM国际地理信息系统进展会议;2026年11月3–6日;美国加利福尼亚州河滨市††期刊年份:2026††版权:acmlicensed††doi:XXXXXXX.XXXXXXX††会议:请从您的权利确认邮件中输入正确的会议标题;2018年6月3–5日;美国纽约州伍德斯托克††isbn:978-1-4503-XXXX-X/2018/06††ccs:应用计算 地球与大气科学††ccs:计算方法 基于回归的监督学习††ccs:计算方法 神经网络
## 1. 引言
理解地球水储量的变化对于量化气候变率和人类活动对全球水循环的影响至关重要。陆地水储量(TWS)包括以雪、冰、土壤水分、地表水和地下水形式储存在地表上下水分的总和,是水文过程的关键整合器。TWS对气候变化高度敏感:它反映了降水、温度和极端天气的变化,其变率与干旱、洪涝和季节性水资源可用性的变化直接相关。因此,准确的TWS数据对于区分自然变率与人为趋势、以及在加速全球变化背景下管理淡水资源至关重要(Yin等,2023(https://arxiv.org/html/2606.23833#bib.bib47);Humphrey和Gudmundsson,2019(https://arxiv.org/html/2606.23833#bib.bib18))。
自2002年以来,重力恢复与气候实验(Tapley等,2004(https://arxiv.org/html/2606.23833#bib.bib12))及其后继任务GRACE-FO(Landerer等,2020(https://arxiv.org/html/2606.23833#bib.bib13))提供了唯一直接、全球一致的TWS变化测量。通过追踪两颗共轨卫星之间的距离变化,这些任务可解析月尺度的地球重力场变化,从而推断质量再分布,包括大陆水体运动、冰块变化和地下水消耗(Jensen等,2020(https://arxiv.org/html/2606.23833#bib.bib20);Tapley等,2019(https://arxiv.org/html/2606.23833#bib.bib40))。与稀疏的地面监测网络不同,GRACE以均匀的精度捕捉地下和大尺度水文过程,使其成为地球系统科学的基准数据集,尤其是在现场观测网络薄弱或缺失的区域(Jensen等,2020(https://arxiv.org/html/2606.23833#bib.bib20))。
然而,观测记录仅跨越二十多年。这对气候科学来说是一个严重限制,因为识别趋势、检测临界点以及将变率归因于诸如厄尔尼诺-南方涛动(ENSO)等大尺度驱动因素,都需要数十年尺度的时间序列(Humphrey和Gudmundsson,2019(https://arxiv.org/html/2606.23833#bib.bib18))。因此,为了覆盖GRACE之前的时期,越来越多的工作利用统计和机器学习方法从气象数据重建类GRACE信号(第3节(https://arxiv.org/html/2606.23833#S3))。然而,现有的大多数方法——网格单元回归、CNN和LSTM——将网格单元视为空间独立,或仅隐式地建模空间上下文。它们因此忽略了水循环固有的网络化特征,其中水文连通性和大气遥相关将遥远区域耦合在一起。
本文报告了将时空**图**深度学习应用于这一重建问题的情况。值得注意的是,我们采用的架构并非为地球科学而设计:多变量时间序列图神经网络(MTGNN)(Wu等,2020(https://arxiv.org/html/2606.23833#bib.bib45))起源于移动性领域,是为预测城市道路传感器网络上的交通状况而开发的。促使转移的结构类比很直接。在交通预测中,传感器构成图的节点,拥堵沿道路网络传播,模型必须捕捉某一点扰动如何延迟影响其他点的读数。在大陆水文中,格点构成节点,水和大气水分沿河流系统和环流模式传播,一个区域的降水异常会滞后数天到数月影响其他区域的水储量。两者都是对一组固定空间嵌入节点(其相互影响具有结构性、时间方向性且仅部分由几何邻近性解释)的多变量时间序列回归问题。我们将MTGNN适配到重力测量环境:1°网格单元成为携带每日ERA5强迫变量的图节点,而一个静态、可解释的邻接矩阵——由测地距离和气候滞后相关性构建——取代了道路网络和MTGNN的学习图,编码了局部水文耦合和长程遥相关。模型在GRACE/GRACE-FO期间训练,将月TWS异常(TWSA)重建至1940年(ERA5再分析的起始年)。本文提出的实现聚焦于南美洲(1,120个陆地块)作为全局设计工作流中的测试区域。
我们的主要贡献是实践和方法层面的:
- •我们展示了一个来自城市移动性预测的图架构如何通过调整适用于重力卫星数据,并记录了使该应用稳健且可解释的设计决策——最值得注意的是用静态、领域信息丰富的混合邻接矩阵替换学习图结构。
- •我们提供了针对GRACE/GRACE-FO(2002–2023年)的多阶段评估,涵盖定量指标、季节性和空间误差结构、年际残差,以及2015/16年厄尔尼诺和2020/21年拉尼娜事件的空间特征。
- •我们将重建结果与三种跨越方法谱系的现有方法进行了基准比较(GTWS-MLrec(Yin等,2023(https://arxiv.org/html/2606.23833#bib.bib47))、RM-REC(Li等,2021(https://arxiv.org/html/2606.23833#bib.bib26))、GRAiCE(Palazzoli等,2025(https://arxiv.org/html/2606.23833#bib.bib31))),并表明图模型在流域尺度统计上具有竞争力(与GRACE相关系数0.94)**仅使用三个输入变量**,而得分更高的基线方法消耗约六到二十多个预测因子,同时揭示了所有模型在干旱、受人类影响的区域共有的弱点。
- •我们报告了经验教训和两条具体的扩展路径:输入参数扩展(温度试点已使网格单元相关系数从0.69提升至0.71)以及通过陆地水均衡方程进行物理信息训练。
## 2. 背景与问题定义
本节提供无需大地测量学或水文学背景即可理解应用所需的领域背景,然后正式阐述学习问题。
### 2.1. 为什么选择GRACE卫星重力测量?
GRACE于2002年发射,是美国国家航空航天局(NASA)与德国航空航天中心(DLR)的合作项目,由两颗在同一轨道上飞行的卫星组成,一前一后。当领先的卫星经过质量稍高的区域(如山脉或雨季后的含水层)时,会比跟随的卫星稍早加速,卫星间距发生变化。K波段微波测距系统持续测量这些距离变化。此外,GRACE-FO(于2018年发射,接替2017年结束的GRACE)增加了一个精度更高的激光测距干涉仪(Tapley等,2019(https://arxiv.org/html/2606.23833#bib.bib40);Chen等,2022(https://arxiv.org/html/2606.23833#bib.bib3))。在一个月内,卫星对采样全球,积累的测距数据被反演成月度的地球重力场模型。
这些月重力场以**球谐系数**表示——这是球面上函数的频域表示,类似于二维傅里叶变换,其中低阶项描述行星尺度结构,高阶项描述更精细的空间细节。本文使用的解解析至96阶,经过必要的空间滤波后有效空间分辨率约为300公里(Kurtenbach等,2012(https://arxiv.org/html/2606.23833#bib.bib25);Chen等,2022(https://arxiv.org/html/2606.23833#bib.bib3))。减去静态平均场可分离出**时变**分量,该分量在陆地主要来源于水量再分布(Sun等,2017(https://arxiv.org/html/2606.23833#bib.bib39))。经过标准校正(第4.1节(https://arxiv.org/html/2606.23833#S4.SS1))后,系数被转换到地理网格上,并以**等效水高**(EWH)表示,即产生观测到的重力变化所需的假设水层厚度。因此,某个网格单元的-0.2米EWH意味着该单元损失了相当于其面积上20厘米水层的质量,无论这种损失发生在土壤水分、地表水还是地下水中。这些值被报告为相对于2004–2009年基线的**异常**(TWSA),因此关注的是偏离参考状态的程度,而非绝对储量。这种综合视角正是GRACE的独特之处,因为数百米深处的地下水消耗对光学和雷达卫星不可见,但重力测量却能探测到。
### 2.2. 再分析数据
模型输入来自ERA5(Hersbach等,2020(https://arxiv.org/html/2606.23833#bib.bib16)),一种大气**再分析**。再分析可以理解为一个全球一致、受物理约束的历史观测记录插值:一个数值天气模型在过去的时间段上运行,在每个同化步骤中,模型状态根据所有可用观测(卫星、气象站、无线电探空仪、船舶、飞机)进行最优校正(Hersbach等,2023(https://arxiv.org/html/2606.23833#bib.bib5))。其结果是一套无间隙、网格化的大气和地表变量估计,在空间、时间和变量间动态一致,不同于稀疏且异质的原始站点数据。对本应用至关重要的是,ERA5回溯至1940年,比首次GRACE观测早了六十多年,且具有全球逐小时覆盖。其质量随时间并非均匀(早期几十年受限于较少观测,卫星时代大约始于1979年),这是所有基于ERA5的重建方法共有的注意事项。
### 2.3. 问题定义
令 \(V=\{v_1,\dots,v_N\}\) 为南美洲1°区域中 \(N=1,120\) 个陆地网格单元的集合,嵌入在一个加权无向图 \(G=(V,E,A)\) 中,邻接矩阵 \(A\in\mathbb{R}^{N\times N}\)(第5.4节(https://arxiv.org/html/2606.23833#S5.SS4))。对于每个日历月份 \(m\),输入是每个节点上长度为 \(T=30\) 天的每日 \(D=3\) 个ERA5通量变量(降水、蒸散发、径流)数据窗口,记作 \(X_m\in\mathbb{R}^{T\times N\times D}\),目标是该月每个节点的GRACE TWSA值,记作 \(y_m\in\mathbb{R}^{N}\)。任务是基于图结构学习一个节点级回归函数
\[
f_\theta: \bigl(X_m,\,G\bigr) \longmapsto \hat{y}_m,
\]
即,通过在有GRACE观测的月份(2002年4月–2023年12月)进行监督训练。重建则是在无重力测量真值的时期(1940–2002年)将训练好的 \(f_\theta\) 应用于ERA5记录。以下两个性质使其成为空间计算问题而非通用回归:连接输入与目标的物理过程在空间上是网络化的(水在网格单元间移动;大气遥相关耦合遥远区域);监督信号的时间分辨率比输入更粗(月度 vs. 每日),因此模型必须学习在图上进行空间聚合以及在窗口内进行时间聚合。任何此类重建所隐含的假设(与第3节(https://arxiv.org/html/2606.23833#S3)所有相关工作共享)是,卫星时代习得的气象强迫与储量响应之间的映射具有足够的平稳性,可以应用于更早的几十年。
## 3. 相关工作
将TWSA扩展到GRACE/GRACE-FO时期之外的方法分为三类:统计方法、基于物理的水文模型,以及日益增多的机器学习方法。我们总结了作为方法背景和后续比较基线的数据驱动重建方法。
Humphrey和Gudmundsson(2019(https://arxiv.org/html/2606.23833#bib.bib18))提出了GRACE-REC,这是一项从1901年到2019年气候驱动TWS的统计重建。一个线性水库模型与...相似文章
GRACE:面向高维时间序列精准因果边发现的门控精化方法
提出GRACE方法,该方法结合基于约束的骨架与使用L0正则化的门控精化,用于高效准确的高维时间序列因果边发现。在F1分数和速度上优于现有方法,并在合成和现实河流流量数据上进行了验证。
用于交通预测的全局-局部图注意力网络
提出了一种具有成对编码和基于事件的邻接矩阵的全局-局部图注意力网络(GLGAT)用于交通预测,有效捕捉时空相关性,并在真实数据集上取得了有竞争力的性能。
面向复杂地质构造中CO2迁移的快速GNN替代模型
本文提出了一种先进的GNN替代模型,用于预测复杂地质构造中CO2羽流迁移,引入了各向异性消息传递机制来处理定向传输,旨在加速碳捕集与封存模拟。
时间增强图注意力网络用于可供性分类
EEG-tGAT是一种时间增强的图注意力网络,通过融合时间注意力和dropout机制来改进交互序列的可供性分类。该模型在GATv2基础上进行了增强,适用于时间维度语义不均匀的序列数据。
用于交通预测的图条件图神经网络专家混合模型
提出了GC-MoE,一种用于交通预测的图条件专家混合框架,该框架根据图拓扑和近期输入为每个节点分配个性化的冻结预训练时空图神经网络专家组合,仅训练一个轻量级路由模块(约1.7万个参数),并在四个基准数据集上取得了有竞争力的性能。