基于生成式机器学习的季节性预报概率偏差订正:以北极海冰预测为例
摘要
本文提出了一种基于条件变分自编码器(cVAE)的概率后处理框架,用于对北极海冰的季节性预报进行偏差订正,相比标准方法,在校准性、锐度及谱功率方面均有提升。
arXiv:2605.29172v1 公告类型:新
摘要:季节性气候预测通过提供未来几个月最可能发生的气候条件及其相关不确定性的早期信息,支持规划和风险管理。集合预报通过模拟多个可能的结果,使预测能够以可用的概率形式表达。大集合和高分辨率预报通过更好地采样不确定性并捕捉更精细尺度的过程,增强了这一指导作用,但带来了显著的计算成本。此外,预报集合会漂移,并表现出随预报时效增长的系统性偏差和时空误差,需要仔细的后处理和校准。加拿大气候建模与分析中心开发了一种基于条件变分自编码器(cVAE)的概率后处理框架,用于生成大幅偏置订正的北极海冰季节性预测集合。该生成模型旨在学习基于有偏模型预测的观测分布。这使得能够生成任意大的、校准良好、偏差已订正且技能提升的预测集合。在此,我们扩展了这一框架,以解决标准cVAE的已知局限性——预测中精细尺度能量的损失和特征性的模糊问题。具体而言,我们在cVAE中使用生成器代替高斯参数化解码器,并在目标函数中使用连续排序概率评分代替均方误差。此外,我们使用了比原始预报更高分辨率的目标数据集。我们表明,相比于基准预测,订正后的预测校准更好,与观测分布更一致,误差更小,同时相对于标准cVAE,增强了原始预报的分辨率,改进了锐度和谱功率。
查看缓存全文
缓存时间: 2026/05/29 09:18
# 利用生成式机器学习进行季节预报的概率偏差校正:以北极海冰预测为例
来源:https://arxiv.org/html/2605.29172
###### 摘要
季节性气候预测通过提供未来几个月最可能发生的气候条件及其相关不确定性的早期信息,支持规划与风险管理。集合预报通过模拟多种可能结果实现了这一点,使预测能以可用概率的形式表达。大集合和高分辨率预报通过更好地采样不确定性并捕捉更精细尺度的过程来增强这种指导,但同时也带来了显著的计算成本。此外,预报集合会漂移,并表现出系统偏差和随预报时效增长而加剧的时空误差,因此需要仔细的后处理与校准。加拿大气候模拟与分析中心开发了一种基于条件变分自编码器(cVAE)的概率后处理框架,用于生成北极海冰季节预测的大集合偏差校正结果。该生成模型旨在学习以有偏模型预测为条件的观测分布。这使我们能够生成任意大的、校准良好且偏差校正的预报集合,并提高预报技巧。在此,我们扩展该框架,以解决标准cVAE已知的局限性:预测中细尺度能量的损失和特征性的模糊性。具体而言,我们在cVAE中使用生成器替代高斯参数化解码器,并在目标函数中使用连续概率排名评分代替均方误差。我们还使用比原始预报更高分辨率的目标数据集。我们表明,调整后的预报校准更好,与观测分布更一致,误差比基准预测更小,同时相对于标准cVAE提高了原始预报的分辨率,并改善了锐利度和谱功率。
## 1 引言
季节性预测指对未来几个月到一年时间尺度上的预报。在加拿大,关键气候变量的季节预报由加拿大季节到年际预测系统(CanSIPS; Merryfield et al., 2013; Lin et al., 2020)生成,该系统结合了两个完全耦合的海洋-大气-陆地-海冰气候模型。每月,模型使用对当前气候状态的估计进行初始化,然后向前积分最多12个月。在加拿大预测系统第三代(CanSIPSv3)中,每个模型产生20个集合成员,其中10个在当月第一日初始化,10个在五天前初始化,从而形成多模型集合预报。其中一个贡献模型是加拿大地球系统模型5.1版(CanESM5.1, Sigmond et al., 2023),由加拿大气候模拟与分析中心(CCCma)开发,源自CanESM5.0(Swart et al., 2019)。CanSIPS的连续版本在多种变量上展示了技巧,包括与冰冻圈相关的变量(Sigmond et al., 2013, 2016; Sospedra-Alfonso et al., 2016a, b, 2024; Dirkson et al., 2021)。这类变量的技巧往往来自其初始异常的“记忆”或持续性,以及局地或远程驱动因素的相互作用。然而,模型固有的缺陷和初始化过程的限制会导致复杂、通常是非线性的系统误差,这些误差随着积分时间(或预报时效,即初始化后发布预报的月数)增长而增大。这些缺陷影响了预报技巧,阻碍了CanSIPS利用关键可预测性来源的能力。为了减轻这种偏差,通常应用后处理技术,方法从简单的依赖预报时效的气候态偏差校正到更复杂的机器学习方法。对于短期到中期天气预报,机器学习,特别是深度学习,已被应用于改善预测系统的集合统计量,包括确定性预报的集合离散度(Sacco et al., 2022)、概率预报的校正(Grönquist et al., 2021),以及使用生成模型从目标预报分布中人工生成高维天气样本(Li et al., 2024)。对于年代际气候预测(将季节预报范围扩展至十年),提出了依赖于预报时效的线性趋势校正(Kharin et al., 2012)和其他各种复杂程度的后处理方法(Pasternack et al., 2018; Nadiga et al., 2019),包括基于深度学习的调整(Sospedra-Alfonso et al., 2025)。在CanSIPS中具有已验证预报技巧的冰冻圈变量中,包含海冰浓度(SIC)(例如 Sigmond et al., 2013, 2016),即模型网格单元内海冰的比例。CanSIPS的北极SIC预报及其下游产品已贡献于多个多模型努力和展望,包括北极气候论坛(世界气象组织北极区域气候中心网络的核心活动,https://www.arctic-rcc.org/acf)。此类预报产品之所以重要,是因为北极海冰覆盖是极地气候系统的关键调节器,塑造了反照率反馈、海洋-大气热交换和大尺度环流。此外,北极海冰覆盖的快速减少(Serreze et al., 2007; Cavalieri and Parkinson, 2012),尤其是夏季的减少,对当地社区和生态系统构成威胁,但也为海洋捕捞、航运、旅游和资源开采创造了经济机会(Kimmritz et al., 2019; Zhang et al., 2022)。因此,为应对这些变化及其影响做准备、减缓和规划需要准确可靠的季节性和长期预测(Wagner et al., 2020)。对于季节性SIC预测,常见的后处理方法包括简单的依赖预报时效的气候态偏差校正、线性回归方法(Blanchard-Wrigglesworth et al., 2017),以及最近的机器学习模型(Palerme et al., 2024; He et al., 2025)。这些技术主要依赖于确定性校正,并受到原始预报集合中计算昂贵的少数成员的限制。因此,即使经过偏差校正,这些预报在边缘海冰覆盖区域也难以从大量天气噪声中分离出可预测信号。大集合可以通过采样许多合理的气候实现来克服这一点,并产生可靠的概率预报、更强大的模型偏差诊断、更清晰的内变率量化以及更好的不确定性表示,包括改进对低概率、高影响极端事件的采样。Gooya 和 Sospedra-Alfonso(2025),以下简称GSA2025,提出了一个基于生成式ML模型的概率偏差调整框架,用于北极SIC的季节预报,克服了这些局限性。该框架基于一个条件变分自编码器(cVAE)模型,该模型的任务是学习以原始季节预报的有偏集合平均为条件的观测分布。通过这种方法,可以生成任意大的偏差调整预报集合。然而,尽管该方法解决了上述问题,但它也有缺点:调整后的预报在细空间尺度上过于平滑,这是原始cVAE公式中的一个已知问题(Larsen et al., 2016; Xu et al., 2025; Dorta et al., 2018)。本研究扩展了GSA2025的工作,以解决这些不足,特别是标准cVAE模型的“模糊”外观问题,即细尺度的梯度、边缘和局地空间变化被模型倾向于输出可能结果中最可能结果的趋势所磨平。我们还研究了这种概率框架产生更高空间分辨率校正预报的潜力,使其实际上成为后处理和降尺度工具。本文其余部分组织如下:第2节和附录A详细介绍了cVAE框架、其用于季节预测偏差调整的公式、cVAE-CRPS模型、神经网络架构以及训练/推理过程。第3节描述了用于训练和评估的数据。第4节和附录B介绍了概率和确定性评估指标,第5节展示了结果。第6节提供讨论和结论。
## 2 方法
### 2.1 条件变分自编码器(cVAE)
GSA2025的生成模型基于条件变分自编码器(cVAE, Sohn et al., 2015),该模型借助不可观测的(潜在)变量 \(z \in \mathcal{Z}\)(Sohn et al., 2015; Prince, 2023),以输入变量 \(x \in \mathcal{X}\) 为条件,对目标变量 \(y \in \mathcal{Y}\) 进行建模。潜在变量 \(z\) 可视为 \(y\) 的低维表示,以更简单的方式解释数据中的变异性。生成过程使用从条件先验分布 \(p_\omega(z|x)\) 中提取的潜在空间 \(\mathcal{Z}\) 中的样本,该分布通常假设为依赖于条件的高斯分布。生成的数据 \(y \in \mathcal{Y}\) 从分布 \(p_\theta(y|z,x)\) 中采样,该分布称为概率解码器。在标准cVAE模型中,解码器假设为高斯分布(Sohn et al., 2015),但这里我们采用不同的方法(第2.2.3节)。分布参数(例如解码器分布和条件先验的均值与标准差)通过最大似然估计学习,这优化了神经网络模型的参数 \(\theta\) 和 \(\omega\),以使生成输出分布中观测目标的似然最大化(Sohn et al., 2015)。Kingma 和 Welling(2014)表明,VAE参数可以使用对数似然的变分下界作为替代目标函数进行有效估计。对于cVAE,替代目标函数为:
\[
\log p(y|x) = \mathrm{KL}\left(q_\phi(z|y,x) \| p(z|y,x)\right) + \mathbb{E}_{q_\phi(z|y,x)}\left[-\log q_\phi(z|y,x) + \log p(y,z|x)\right]
\]
\[
\geq -\mathrm{KL}\left(q_\phi(z|y,x) \| p_\omega(z|x)\right) + \mathbb{E}_{q_\phi(z|y,x)}\left[\log p_\theta(y|z,x)\right],
\]
其中 \(\mathrm{KL}\) 项指Kullback-Leibler散度。分布 \(q_\phi(z|y,x)\) 被称为概率编码器,也假设为高斯分布,用于近似真实但难以计算的真实后验分布 \(p(z|y,x)\)(Kingma and Welling, 2014; Sohn et al., 2015)。其参数也在训练过程中通过一个参数为 \(\phi\) 的独立神经网络进行学习。
### 2.2 季节预测的概率偏差调整
对于季节预测集合的概率偏差调整,目标是学习从有偏的集合平均预报 \(\bar{x}_{tl}\)(其中 \(t\) 表示初始化时间,\(l\) 表示预报时效)到观测分布 \(p(Y|\bar{x}_{tl})\) 的映射(GSA2025)。尽管存在偏差,\(\bar{x}_{tl}\) 模拟了气候系统的可预测部分,既包括外部强迫,也包括内变率(后者只有通过预报初始化才可能实现)。观测 \(y_{tl}\)(为了简洁起见,使用与预报相同的初始时间和预报时效符号)是气候系统从一系列可能状态中实现的结果,这些状态定义了目标观测分布。因此,我们有兴趣对以携带预报可预测分量的有偏集合平均为条件的观测分布进行建模。GSA2025通过最大化观测 \(y_{tl}\) 在条件分布 \(p_\theta(Y=y_{tl}|\bar{x}_{tl})\) 中的对数似然(\(\max_\theta \log p_\theta(Y=y_{tl}|\bar{x}_{tl})\))来实现这一点,cVAE模型公式如下:
编码器:\(q_\phi(z|y_{tl}, \bar{x}_{tl}) = \mathcal{N}\left(\mu_{NN_\phi}(y_{tl}, \bar{x}_{tl}), \sigma_{NN_\phi}^2(y_{tl}, \bar{x}_{tl})I\right)\)
解码器:\(p_\theta(y|z, \bar{x}_{tl}) = \mathcal{N}\left(\mu_{NN_\theta}(z, \bar{x}_{tl}), \sigma^2 I\right)\)
先验:\(p_\omega(z|\bar{x}_{tl}) = \mathcal{N}\left(\mu_{NN_\omega}(\bar{x}_{tl}), \sigma_{NN_\omega}^2(\bar{x}_{tl})I\right)\)
其中 \(I\) 是单位矩阵,\(\sigma^2\) 为 ...相似文章
AdaWeather: 自适应混合概率天气预报与对数遗憾
介绍了AdaWeather,一个自适应框架,它利用机器学习和专家混合来组合多个概率天气预报,相比最佳的静态专家混合实现了对数遗憾,并在温度预报方面展示了实证改进。
基于解码器的生成模型的定量分析
本文提出使用退火重要性采样(Annealed Importance Sampling)来评估基于解码器的生成模型(VAE、GAN等)的对数似然,解决了难以计算似然估计的问题。作者验证了该方法的有效性,并提供了评估代码来分析模型性能、过拟合情况和模式覆盖度。
SAGA:一种序列自适应生成架构,用于多步概率预测与自适应时间共形预测
SAGA引入了一种仅解码器变压器,用于终身收入的多步概率预测,并配合自适应共形预测提供可靠的预测区间。基于大型瑞典注册数据集训练,相较于传统参数模型和基线模型取得了显著改进。
面向跨区域太阳能和风能预测的量子启发变分核与可解释人工智能框架
一篇研究论文,提出了一种用于太阳能和风能预测的四阶段混合框架,利用量子启发变分核进行残差修正,并利用生成式人工智能层实现可解释性。
CF-JEPA:利用不对称编码器进行无掩码前向预测的时间序列表示学习
提出CF-JEPA,一种无掩码的自监督学习框架,用于时间序列表示学习。该方法通过从随机裁剪中进行多视野前向预测,并利用在线编码器与指数移动平均目标编码器之间的不对称性,在分类、预测和异常检测任务上提升了性能。