Njord：一种用于集合海洋预报的概率图神经网络

arXiv cs.LG 2026/05/18 04:00 论文

摘要

Njord是一种用于集合海洋预报的概率图神经网络，它提供不确定性估计，并在全球和区域基准上取得了最先进的性能，改进了海表温度预测。

arXiv:2605.15470v1 类型：新论文摘要：海洋动力系统本质上是混沌的，但现有的机器学习海洋模型仅能产生确定性预报。我们提出了Njord，一种用于海洋预报的概率数据驱动模型，可应用于全球和区域领域。Njord将深度潜变量框架与图神经网络架构相结合，使得每个预报步骤能够通过单次前向传播进行采样。我们在全球以0.25°分辨率、在波罗的海区域以2千米分辨率应用Njord。为了扩展到这些大型海洋网格，我们引入了K-means聚类网格，该网格能够适应不规则的海洋表面几何形状。实验表明，与确定性机器学习基线相比，Njord在两个域上均表现出强劲性能，同时通过采样集合预报提供不确定性估计。在全球OceanBench基准测试中，Njord在评估真实观测数据时，在上层海洋变量上平均获得最低误差，其中海表温度预测的提升最大。

查看原文

查看缓存全文

缓存时间: 2026/05/18 06:41

# Njord：一种用于集合海洋预报的概率图神经网络
来源：https://arxiv.org/html/2605.15470
Daniel Holmberg
赫尔辛基大学
daniel\.holmberg@helsinki\.fi
&Joel Oskarsson
ETH AI Center
joel\[email protected]
Erik Larsson
林雪平大学
erik\.larsson@liu\.se
&Fredrik Lindsten
林雪平大学
fredrik\.lindsten@liu\.se
&Teemu Roos
赫尔辛基大学
teemu\.roos@helsinki\.fi

###### 摘要

海洋动力学本质上是混沌的，但现有的机器学习海洋模型仅产生确定性预报。我们提出*Njord*，一种概率数据驱动的海洋预报模型，可同时应用于全球和区域海域。Njord 结合了深度潜变量框架与图神经网络架构，使得每个预报步骤可在单次前向传递中进行采样。我们将 Njord 应用于全球（0.25° /0.25\\text\{\\,\}\\mathrm\{\\SIUnitSymbolDegree\}\\text\{/\} 分辨率）和波罗的海区域（2km /2\\text\{\\,\}\\mathrm\{km\}\\text\{/\} 分辨率）。为了扩展到这些大型海洋网格，我们引入了K均值聚类网格，以适应不规则的海面几何形状。实验表明，该模型在两个海域均表现出与确定性机器学习基线相当的强劲性能，同时还通过采样的集合预报提供不确定性估计。在全局 OceanBench 基准测试中，Njord 在评估对上洋变量的预测时，平均误差最低，其中海表温度预测的提升最大。

## 1 引言

精确的海洋预报对于从海上导航、渔业管理到沿海灾害缓解和环境监测[33 (https://arxiv.org/html/2605.15470#bib.bib9)]等广泛应用至关重要。虽然数值海洋模型长期以来一直是业务化预报的支柱，但它们在运行所需的业务化全球[35 (https://arxiv.org/html/2605.15470#bib.bib30)]和区域[27 (https://arxiv.org/html/2605.15470#bib.bib13)]分辨率下计算成本高昂，需要在CPU集群上耗费数小时[14 (https://arxiv.org/html/2605.15470#bib.bib18),22 (https://arxiv.org/html/2605.15470#bib.bib5)]。最近的进展表明，机器学习海洋模型可以在计算成本的一小部分内，匹配甚至超越基于物理的系统的准确性[14 (https://arxiv.org/html/2605.15470#bib.bib18),9 (https://arxiv.org/html/2605.15470#bib.bib19),46 (https://arxiv.org/html/2605.15470#bib.bib20),25 (https://arxiv.org/html/2605.15470#bib.bib21)]参考图说明Figure 1:Njord.，尤其是在全球短期（1–10天）时间尺度上。然而，这些模型是确定性的：它们产生单一轨迹，通常使用均方误差进行训练，这促使预测朝向未来状态的条件均值，而非捕捉完整的预测分布。因此，它们往往平滑掉小尺度方差，并对极端事件的概率提供的洞察有限。在业务化决策中，风险缓解依赖于对预报置信度和可能情景全谱的理解，单一轨迹往往不够。概率预报通过建模未来状态的分布，能够生成捕捉动态变异性并量化不确定性的集合，在此增加了关键价值。在大气领域，条件生成模型[39 (https://arxiv.org/html/2605.15470#bib.bib2),43 (https://arxiv.org/html/2605.15470#bib.bib34)]已成为产生有技巧且空间连贯的集合预报的有前景框架，但海洋领域尚无类似的可比概率数据驱动模型。在这项工作中，我们提出了——据我们所知——首个用于短期高分辨率全球和区域海洋预报的概率数据驱动模型。该模型采用基于层次化图神经网络（GNN）[39 (https://arxiv.org/html/2605.15470#bib.bib2)]的潜变量架构，并产生经过校准的深度解析海洋状态集合预报。在区域设定中，模型还以独立全球海洋模型的边界数据为条件，而此前此类模拟器要么缺乏边界强迫[7 (https://arxiv.org/html/2605.15470#bib.bib17)]，要么在边界处依赖它们试图替代的同一系统的数据[22 (https://arxiv.org/html/2605.15470#bib.bib5)]。

#### 我们的贡献如下：

1. 1.我们提出*Njord*222在古北欧神话中，Njord 是海神。见Figure1 (https://arxiv.org/html/2605.15470#S1.F1).，这是首个用于全球海洋物理的生成式集合预报模型，运行于0.25° /0.25\\text\{\\,\}\\mathrm\{\\SIUnitSymbolDegree\}\\text\{/\} 分辨率。
2. 2.Njord 采用了一种基于新聚类图布局的GNN架构，该布局更好地适应了海洋表面的不规则几何形状。
3. 3.除了现有高分辨率机器学习海洋模型中包含的变量外，我们加入了海冰。海冰是海洋物理模拟的组成部分，但需要额外约束以确保物理上真实可信的场。
4. 4.我们遵循 OceanBench[13 (https://arxiv.org/html/2605.15470#bib.bib24)]对全球海洋模拟器的评估，表明 Njord 在与最先进模型的比较中达到了有竞争力的误差，同时通过集合方法增加了不确定性信息。在关键表面变量上，Njord 在与分析数据和直接观测值对比时均取得了最低误差。
5. 5.我们进一步展示了同一框架可用于区域海洋建模，通过构建用于波罗的海的 Njord-Baltic，运行于2km /2\\text\{\\,\}\\mathrm\{km\}\\text\{/\} 分辨率。Njord-Baltic 在提供概率预报的同时，实现了与确定性基线相当的误差。

## 2 相关工作

#### 海洋模拟器。
在中期时间尺度上，数据驱动的全球海洋模型[46 (https://arxiv.org/html/2605.15470#bib.bib20),14 (https://arxiv.org/html/2605.15470#bib.bib18),9 (https://arxiv.org/html/2605.15470#bib.bib19),25 (https://arxiv.org/html/2605.15470#bib.bib21)]在确定性预报方面展现了良好性能。区域方法也显示出了前景：OceanNet[7 (https://arxiv.org/html/2605.15470#bib.bib17)] 在预测海面高度（SSH）方面能够超越动力海洋模型；SeaCast[22 (https://arxiv.org/html/2605.15470#bib.bib5)] 在以4km /4\\text\{\\,\}\\mathrm\{km\}\\text\{/\} 分辨率预报地中海方面比业务化数值模型更有技巧。除了中期预报，深度学习已应用于季节海洋预报[3 (https://arxiv.org/html/2605.15470#bib.bib40),45 (https://arxiv.org/html/2605.15470#bib.bib33)]和气候预测[10 (https://arxiv.org/html/2605.15470#bib.bib39)]。尽管取得了这些进步，但数据驱动模型的集合海洋预报仍鲜有探索。最近，FuXi-ONS[26 (https://arxiv.org/html/2605.15470#bib.bib25)] 通过向确定性核心添加学习到的扰动，在 1° /1\\text\{\\,\}\\mathrm\{\\SIUnitSymbolDegree\}\\text\{/\} 网格间距和 5 天间隔下，将全球海洋模拟扩展到了集合设置。该模型未纳入我们的比较，因为它关注的时间尺度和分辨率与我们的设置不同，并且也未训练以匹配未来状态的分布。

#### 概率天气预报。
我们的方法深受数据驱动集合天气预报进展的启发。GenCast[43 (https://arxiv.org/html/2605.15470#bib.bib34)] 引入了基于扩散的中期集合预报。扩散模型在捕捉高分辨率细节方面效果显著[42 (https://arxiv.org/html/2605.15470#bib.bib49),32 (https://arxiv.org/html/2605.15470#bib.bib1)]，但计算量大，因为生成单个预报需要多次顺序前向传递。最近，使用连续排序概率评分（CRPS）作为训练目标来训练生成式预报模型已成为一种流行方法，无论是全球[30 (https://arxiv.org/html/2605.15470#bib.bib23),41 (https://arxiv.org/html/2605.15470#bib.bib37),6 (https://arxiv.org/html/2605.15470#bib.bib38),2 (https://arxiv.org/html/2605.15470#bib.bib22)]还是区域尺度[31 (https://arxiv.org/html/2605.15470#bib.bib41),38 (https://arxiv.org/html/2605.15470#bib.bib50)]都是如此。这些方法主要在随机性引入方式和CRPS估计方式上有所区别。基于CRPS的模型在推理期间的效率至少比基于扩散的方法高一个数量级。我们的工作建立在 Graph-EFM[39 (https://arxiv.org/html/2605.15470#bib.bib2)] 潜变量模型之上，该模型结合了变分训练和基于CRPS的目标函数。Graph-EFM 纯粹是一个天气模型，我们通过架构修改将其扩展到了海洋领域，这些修改使得在更大且更不规则的海洋网格上进行高效建模成为可能。

参考图说明Figure 2:Njord 模型中的一步预测。残差在时间 tt 进行预测，然后与前一个状态 Xt−1X^{t-1} 相加，以生成样本 X^t\\hat{X}^{t}。Njord-Baltic 的相应概述在附录的Figure ̃12 (https://arxiv.org/html/2605.15470#A3.F12) 中给出。

## 3 背景

### 3.1 问题形式化

我们面对的是这样一个预报任务：将初始海洋状态的序列 X−p+1:0=(X−p+1,…,X0)X^{-p+1:0}=(X^{-p+1},\\ldots,X^{0})（其中 pp 是过去步数）映射到未来状态的序列 X1:T=(X1,…,XT)X^{1:T}=(X^{1},\\ldots,X^{T})。每个状态 Xt∈RN×dxX^{t}\\in\\mathbb{R}^{N\\times d_{x}} 包含位于 NN 个不同网格位置上的 dxd_{x} 个海洋变量。这些状态变量包括在多个垂直深度层上建模的量以及表面变量。除了初始状态外，模型还在相同的 NN 个网格点上接收额外的强迫输入。该强迫 F−p+1:TF^{-p+1:T} 包括：1）已知的动态因子，如年积日；2）静态特征，例如深度；3）由天气模型给出的海表大气强迫。大气强迫包括与风、气压和温度相关的相关场，它们驱动海洋表面动力学。在附录̃B (https://arxiv.org/html/2605.15470#A2) 中，我们提供了所有状态和强迫变量的完整列表。

对于集合预报，我们特别关注从初始状态到预报的概率映射。因此，我们旨在建模一个分布 p(X1:T∣X−p+1:0,F−p+1:T)p(X^{1:T}\\mid X^{-p+1:0},F^{-p+1:T})，描述可能的未来海洋状态。在状态仅依赖于前 pp 个状态这一马尔可夫假设下，该分布在时间上分解，建立 p(Xt∣Xt−p:t−1,F−p+1:T)p(X^{t}\\mid X^{t-p:t-1},F^{-p+1:T}) 的模型就足够了。然后可以通过从该分布中顺序采样 XtX^{t}，并以下一个时间步的采样值为条件，来生成集合成员（X1:TX^{1:T} 的样本）。

### 3.2 使用潜变量模型的集合预报

上述集合预报问题可以通过训练一个深度生成模型来近似产生来自 p(Xt∣Xt−p:t−1,F−p+1:T)p\\mathopen{}\\mathclose{}{\\left(X^{t}\\mid X^{t-p:t-1},F^{-p+1:T}\\right)} 的样本来解决。此类模型之一便是深度潜变量模型，类似于条件变分自编码器[44 (https://arxiv.org/html/2605.15470#bib.bib45)]，它们学习从条件输入和一个潜随机变量 ZtZ^{t} 到分布样本的映射。通常，条件输入集仅限于一部分强迫和先前状态。在我们的设定中，此类模型由一个神经网络 fθf_{\\theta} 构成，实现映射：

X^t=fθ(Xt−2:t−1,Ft−2:t,Zt),Zt∼N(μt,I)\\hat{X}^{t}=f_{\\theta}\\mathopen{}\\mathclose{}{\\left(X^{t-2:t-1},F^{t-2:t},Z^{t}\\right)},\\qquad Z^{t}\\sim\\mathcal{N}\\mathopen{}\\mathclose{}{\\left(\\mu^{t},I\\right)} (1)

其中 ZtZ^{t} 被选为各向同性高斯分布。此采样隐含地指定了模型分布 p^θ(Xt∣Xt−2:t−1,Ft−2:t)\\hat{p}_{\\theta}\\mathopen{}\\mathclose{}{\\left(X^{t}\\mid X^{t-2:t-1},F^{t-2:t}\\right)}。由于在这些模型中采样仅需一次单次前向传递 fθf_{\\theta}，因此计算效率远高于扩散模型的迭代采样[43 (https://arxiv.org/html/2605.15470#bib.bib34),20 (https://arxiv.org/html/2605.15470#bib.bib46),16 (https://arxiv.org/html/2605.15470#bib.bib51),32 (https://arxiv.org/html/2605.15470#bib.bib1)]。

最近，对在地球系统建模中使用深度潜变量模型的兴趣日益增长[24 (https://arxiv.org/html/2605.15470#bib.bib48),39 (https://arxiv.org/html/2605.15470#bib.bib2),30 (https://arxiv.org/html/2605.15470#bib.bib23),2 (https://arxiv.org/html/2605.15470#bib.bib22),6 (https://arxiv.org/html/2605.15470#bib.bib38)]。在这项工作中，我们基于之前用于天气预报的 Graph-EFM[39 (https://arxiv.org/html/2605.15470#bib.bib2)] 潜变量模型。Graph-EFM 使用构建的网格图结构和GNN层[4 (https://arxiv.org/html/2605.15470#bib.bib3)]来捕捉预报区域上的空间关系。神经网络 fθf_{\\theta} 采用编码-过程-解码架构实现为GNN。网格化输入首先映射到网格图上的潜表示。然后，模型的处理器部分由一组在不同空间分辨率上运行的层次化GNN层组成，ZtZ^{t} 在最粗层次上通过添加到潜表示而整合进来。由于GNN从该粗表示向下通过层次进行映射，并最终解码回原始网格点，因此 ZtZ^{t} 的随机性可以影响模型的所有输出。这些输出随后通过残差连接添加到前一个状态 Xt−1X^{t-1}，最终生成随机样本 X^t\\hat{X}^{t}。在 Graph-EFM 中，ZtZ^{t} 另外从一个具有学习均值的先验分布中采样，即 μt=gθ(Xt−2:t−1,Ft−2:t)\\mu^{t}=g_{\\theta}\\mathopen{}\\mathclose{}{\\left(X^{t-2:t-1},F^{t-2:t}\\right)}。该先验映射实现为另一个层次化GNN。模型通过优化证据下界（ELBO）进行训练，这还需要训练一个用于 ZtZ^{t} 的独立编码器网络。该编码器结构与先验类似，但仅作为训练所需的辅助模块，预报时不需要。关于 Graph-EFM 的更多细节，请参见附录̃A (https://arxiv.org/html/2605.15470#A1) 和 Oskarsson 等人[39 (https://arxiv.org/html/2605.15470#bib.bib2)]。在推理时，每个集合成员在时间步 tt 通过以下方式采样：1）抽取样本 Zt∼N(μt,I)Z^{t}\\sim\\mathcal{N}\\mathopen{}\\mathclose{}{\\left(\\mu^{t},I\\right)}，以及 2）将该样本与条件变量一起通过 fθf_{\\theta} 传播，以生成 X^t\\hat{X}^{t}。这一过程在 TT 个时间步上自回归地重复进行，每一步以前面采样的状态为条件，以获得完整的状态轨迹。通过对独立样本重复此过程（各成员间完全可并行化），生成完整的集合。

## 4 Njord：一种基于图的概率海洋模型

Njord：一种用于集合海洋预报的概率图神经网络

相似文章

用于交通预测的图条件图神经网络专家混合模型

GNBAN：面向大规模实体集长期预测的图神经基注意力网络

FFJORD: 用于可扩展可逆生成模型的自由形式连续动力学

基于经验神经正切核的极端天气预报可扩展不确定性量化

在资源受限环境下利用常规数据重建和预测阿尔茨海默病患者疾病轨迹

提交意见反馈