AirCast-SR: 基于潜在一致性扩散的公里尺度大气超分辨率基础模型

arXiv cs.LG 论文

摘要

AirCast-SR 是一个基于扩散模型的基础模型,能够将全球AI天气预报从0.25°降尺度到1公里分辨率,每小时生成一次预报,可产生67小时预报,具有接近零偏差和结构真实感,同时在单个商用GPU上仅需数分钟即可完成推理。

arXiv:2605.26130v1 公告类型: 新论文 摘要:对于传统数值天气预报(NWP)模型而言,在公里尺度上进行业务天气预报仍然计算成本过高,限制了需要精细时空细节的应用(如能源、农业和灾害管理)对预报的获取。在此,我们介绍 AirCast-SR,一个用于大气超分辨率的基础模型,它将全球AI天气预报从0.25度(约28公里)降尺度到1公里水平分辨率,时间分辨率为每小时,同时生成八个耦合地表变量的67小时预报。EarthMind-SR 采用三维 U-Net,并在潜在一致性模型(LCM)扩散框架内进行条件化训练,使用基于图块(patch)的样本(覆盖美国本土CONUS),以 GraphCast 预报作为输入,以 NOAA 校准记录分析(AORC)作为目标。该模型在所有变量和预报时效上实现了接近零的偏差,其径向功率谱密度分析表明,在10公里到100公里波长范围内(较粗模型会失去频谱功率)保留了精细尺度的大气结构。我们通过跨越冬季、夏季和春季的三个CONUS案例研究验证了 EarthMind-SR,并展示了其在印度和德国使用独立地面站观测数据进行的零样本全局迁移能力,无需任何重新训练或微调。作为一个开放权重的基础模型,EarthMind-SR 为公里尺度AI天气预报建立了新范式,并为区域微调、蒸馏以及气候服务和灾害预报中的下游应用提供了平台。
查看原文
查看缓存全文

缓存时间: 2026/05/27 09:03

# AirCast-SR:基于潜在一致性扩散的公里级大气超分辨率基础模型

来源:https://arxiv.org/html/2605.26130

Somnath Luitel† 地球、环境与大气科学系,西肯塔基大学,Bowling Green,肯塔基州,美国
Manmeet Singh†,* 地球、环境与大气科学系,西肯塔基大学,Bowling Green,肯塔基州,美国
Joshua Durkee 地球、环境与大气科学系,西肯塔基大学,Bowling Green,肯塔基州,美国
Naveen Sudharsan 德克萨斯大学奥斯汀分校,奥斯汀,德克萨斯州,美国
Prabhjot Singh 德克萨斯大学奥斯汀分校,奥斯汀,德克萨斯州,美国
Cenlin He 美国国家科学基金会国家大气研究中心,博尔德,科罗拉多州,美国
Harsh Kamath 德克萨斯大学奥斯汀分校,奥斯汀,德克萨斯州,美国
Zong-Liang Yang 德克萨斯大学奥斯汀分校,奥斯汀,德克萨斯州,美国
Krishnagopal Halder 莱布尼茨农业景观研究中心 (ZALF),柏林,德国
Sandeep Juneja 阿育王大学,索尼帕特,印度
Parthasarathi Mukhopadhyay 阿育王大学,索尼帕特,印度
Saptarishi Dhanuka 阿育王大学,索尼帕特,印度
Amit Kumar Srivastava 莱布尼茨农业景观研究中心 (ZALF),柏林,德国

###### 摘要

*同等贡献(共同第一作者)。*通讯作者:[email protected]
公里级天气预报对于传统数值天气预报(NWP)模型而言计算成本过高,因此精细预报仅限于少数在超级计算基础设施上运行的操作系统。在此,我们介绍AirCast-SR,一个基于扩散的基础模型,可将全球AI天气预报从0.25°(约28公里)降尺度到1公里分辨率,以每小时为间隔,同时生成七个耦合的近地面变量长达67小时的预报。AirCast-SR将三维U-Net与潜在一致性模型(LCM)扩散框架相结合,在美国本土(CONUS)上基于图块样本进行训练,以GraphCast预报作为输入,NOAA的校准分析记录(AORC)作为目标。在两次极端事件(2022年12月的冬季风暴Elliott和2022年6月的夏季对流事件)以及一个春季过渡案例(2023年3月)中,AirCast-SR在48小时前的所有变量和所有预报时效上均实现了近乎零的系统偏差,同时其径向功率谱密度在10公里至100公里的波长范围内追踪AORC参考值,而较粗的模型在此范围内会损失谱功率。该模型在逐点技能上接近但尚未超过业务化的高分辨率快速刷新(HRRR)模式,但它在大多数变量上实现了更广泛的耦合变量覆盖、通过扩散实现的物理结构真实性(生成式超分辨率中的感知-失真机制),以及在单个商用GPU上数分钟内完成推理。在无需重新训练的情况下,AirCast-SR可零样本泛化到印度和德国,并通过StationBench进行地面站点观测验证。AirCast-SR以开放权重发布,为公里级AI天气预报服务奠定了基础,并提供了清晰的扩展路径——更多计算资源、更多训练年份、集成推理——以最终超越业务化NWP系统。

## I. 引言

过去三年见证了天气预报的变革性转变,基于AI的模型在全局尺度上实现了与最先进的数值天气预报(NWP)系统相当或更优的预报技能[1 (https://arxiv.org/html/2605.26130#bib.bib1),2 (https://arxiv.org/html/2605.26130#bib.bib2),3 (https://arxiv.org/html/2605.26130#bib.bib3),4 (https://arxiv.org/html/2605.26130#bib.bib4)]。GraphCast[1 (https://arxiv.org/html/2605.26130#bib.bib1)]、Pangu-Weather[2 (https://arxiv.org/html/2605.26130#bib.bib2)]和GenCast[5 (https://arxiv.org/html/2605.26130#bib.bib5)]等模型可以在单个GPU上以0.25°至1°的分辨率在数秒内生成中期预报,从而普及全球天气预报的获取。然而,这些全球AI模型的分辨率通常为25公里或更粗,这为日益增长的需求公里级、每小时气象场的应用[6 (https://arxiv.org/html/2605.26130#bib.bib6)]留下了结构性缺口:可再生能源管理、精准农业、城市水文、野火蔓延和局部灾害响应。

传统上,弥补这一缺口需要计算成本高昂的有限区域NWP模型,例如NOAA的高分辨率快速刷新(HRRR)模式[7 (https://arxiv.org/html/2605.26130#bib.bib7)],该模式以3公里分辨率在美国本土(CONUS)上运行,并在超级计算基础设施上每小时更新一次。HRRR设定了美国短程、公里级预报的业务基准。然而,其计算成本限制了可维持的空间域和集合大小,并且目前没有业务系统能够在全球任意大陆域提供1公里、每小时分辨率的完整耦合近地面变量集(温度、湿度、风分量、气压、降水和长波辐射)。

统计和机器学习降尺度提供了一条以大幅降低的成本获取公里级场数据的途径。经典方法包括偏差校正和空间分解(BCSD)[8 (https://arxiv.org/html/2605.26130#bib.bib8)]、构造模拟[9 (https://arxiv.org/html/2605.26130#bib.bib9)]以及基于回归的方法[10 (https://arxiv.org/html/2605.26130#bib.bib10)]。最近的深度学习方法应用了卷积网络[11 (https://arxiv.org/html/2605.26130#bib.bib11),12 (https://arxiv.org/html/2605.26130#bib.bib12)]、生成对抗网络(GANs)[13 (https://arxiv.org/html/2605.26130#bib.bib13),14 (https://arxiv.org/html/2605.26130#bib.bib14)]和扩散模型[15 (https://arxiv.org/html/2605.26130#bib.bib15)]进行大气降尺度。其中,基于扩散的模型显示出特别的前景:它们生成物理上真实的精细结构,而没有困扰GAN的模式崩溃[16 (https://arxiv.org/html/2605.26130#bib.bib16),17 (https://arxiv.org/html/2605.26130#bib.bib17)],并且它们自然地处于生成式超分辨率的*感知-失真*权衡中[25 (https://arxiv.org/html/2605.26130#bib.bib25)],其中结构真实性(陡峭梯度、中尺度变率)得以恢复,但以一定的逐点像素精度为代价。

在这项工作中,我们介绍AirCast-SR(超分辨率),一个基于扩散的基础模型,同时满足三个耦合要求。首先,*能力*要求:同时预测七个耦合的近地面变量——降水、2米温度、2米比湿、10米u和v风分量、地面气压和向下的长波辐射——在1公里和1小时分辨率下,覆盖67小时的预报窗口,这是目前全球任何业务系统都未实现的配置。其次,*成本*要求:在单个商用GPU上数分钟内完成整个CONUS的完整推理,这与有限区域NWP所需的超级计算预算形成对比。第三,*泛化*要求:该模型在CONUS上训练,但预计能通过基于物理特征(地形、太阳强迫)而非区域模式的图块学习,零样本迁移到其他大陆。AirCast-SR以6小时间隔的0.25° GraphCast预报作为条件输入,并同时生成七个近地面变量的1公里、每小时预测。我们以AORC参考数据对其进行评估,使用HRRR作为业务基准,GraphCast作为AI基线。

## II. 方法

### II.1 模型架构

AirCast-SR构建在潜在一致性模型(LCM)[20 (https://arxiv.org/html/2605.26130#bib.bib20)]扩散框架内的三维U-Net架构[18 (https://arxiv.org/html/2605.26130#bib.bib18),19 (https://arxiv.org/html/2605.26130#bib.bib19)]之上。三维架构在单次前向传递中共同处理空间(1公里)和时间(小时)维度,从而在67小时预报窗口内保持多变量物理一致性。降噪器是一个UNet3DConditionModel,具有28个输入通道(7个目标变量 + 20个条件通道),块通道为(64,128,256,512),四个编码器/解码器阶段,每个块两层,使用八组进行组归一化,以及八头的交叉注意力。20个条件通道包括:在三个气压层采样的17个GraphCast大气变量(从0.25°双线性插值到1公里目标网格)、归一化地形、天空可视因子以及太阳天顶角的余弦值。从T_cond=12(6小时间隔的GraphCast视界)到T_target=67的时间插值使用三线性插值。

我们未采用需要数百步降噪的标准去噪扩散概率模型(DDPM)方法[16 (https://arxiv.org/html/2605.26130#bib.bib16)],而是采用了LCM框架[20 (https://arxiv.org/html/2605.26130#bib.bib20)],该框架将扩散过程提炼为一致性函数,从而能够在4-25步降噪中生成高质量结果。噪声调度使用1000个训练步和缩放线性β调度。训练过程中,高斯噪声ε ~ N(0,I) 在均匀采样的时间步k处添加到归一化目标中,模型通过均方误差损失预测噪声。推理时,生成从z_T ~ N(0,I)开始,并通过LCM求解器迭代。尽管AirCast-SR是作为每个随机种子的确定性点估计进行训练的,但底层模型本质上是概率性的:独立的随机种子会产生统计上不同的实现,为后续工作中的集合推理和概率评估技能提供了自然途径。

### II.2 训练数据与过程

0.25°分辨率(6小时间隔)的GraphCast再分析预报作为输入;NOAA AORC v1.1 1公里、每小时分辨率的场数据[21 (https://arxiv.org/html/2605.26130#bib.bib21)]作为目标。训练域为CONUS,训练期为2021日历年(约300个初始化时刻)。所有变量均进行最小-最大归一化至[0,1];降水使用log(1+x)变换后的最小-最大缩放。训练样本为64×64像素图块,在CONUS内随机空间位置抽取,批次大小为1,使用AdamW优化器,学习率10^{-4},权重衰减10^{-2},并根据全局最佳验证损失选择检查点。GraphCast条件场按初始化时刻预先生成,以提高I/O效率。

##### 时间训练/测试分离。

本工作中报告的所有评估案例均在2021年训练期*之外*。CONUS案例研究为2022年12月22日(冬季风暴Elliott)、2022年6月12日(一次大陆尺度对流事件)和2023年3月31日(春季锋面过渡);国际案例分别于2023年3月3日(印度)和2023年8月16日(德国)初始化。这些初始化时刻的数据——无论是GraphCast条件场还是AORC目标——在训练、验证或超参数选择过程中均未出现。这种严格的时间分离对于天气预报模型的诚实评估至关重要,因为随机时间采样会因底层气象学的自相关性而产生乐观结果[24 (https://arxiv.org/html/2605.26130#bib.bib24)]。

### II.3 推理

推理时,目标域被划分为256×256的图块,步长为128像素(50%重叠)。图块独立进行降噪,并通过余弦锥形空间混合[22 (https://arxiv.org/html/2605.26130#bib.bib22)]合并,消除边界伪影。模型支持4、8、25或50步降噪;下文结果使用25步。在单个NVIDIA A100 GPU上,完整的CONUS 1公里、每小时分辨率67小时预报可在数分钟内完成。

## III. 结果

我们评估了AirCast-SR在三个CONUS案例研究(两次极端事件和一次过渡)以及两个国际域上的零样本迁移能力。选择这些案例是为了涵盖业务化公里级预报必须服务的高影响状态范围:*冬季风暴Elliott*(2022年12月22日初始化),一次历史性的北极冷空气爆发,给美国东部带来了暴风雪条件和创纪录的低压;*2022年6月大陆对流事件*(2022年6月12日初始化),一次持续数天的有组织中尺度对流系统模式,横跨大平原和中西部;以及一次*春季锋面过渡*(2023年3月31日初始化),代表主导CONUS季节可预测性的冷季到暖季模式转变。所有三个案例完全不在2021年训练期内。预测结果与AORC v1.1(1公里、每小时分辨率的验证参考)、HRRR(3公里业务NWP基准)[7 (https://arxiv.org/html/2605.26130#bib.bib7)]以及原始GraphCast输入(0.25°、6小时间隔的AI基线)进行比较。

#### III.0.1 地面气压

地面气压(表3 (https://arxiv.org/html/2605.26130#S4.T3);图2 (https://arxiv.org/html/2605.26130#S4.F2))是AirCast-SR近乎零偏差特性的最清晰展示。在所有三个案例和所有48小时前的预报时效中,AirCast-SR相对于AORC保持r>0.96,绝对偏差低于7 Pa——大约比HRRR在春季案例中的系统偏差11.7 Pa小一到两个数量级(图2 (https://arxiv.org/html/2605.26130#S4.F2))。空间图显示,AirCast-SR能够解析天气尺度气压模式(与风暴Elliott相关的深低压,春季锋面槽),而不会引入纯回归降尺度中常见的平滑场伪影。

#### III.0.2 2米温度

AirCast-SR在跨季节的温度预测中表现出色(表2 (https://arxiv.org/html/2605.26130#S4.T2);图3 (https://arxiv.org/html/2605.26130#S4.F3))。对于冬季风暴Elliott在6小时预报时效,AirCast-SR相对于AORC的r=0.972,偏差仅为-0.007 K。在所有三个案例的6小时预报时效上,AirCast-SR的r值在0.88(夏季)到0.97(冬季)之间,偏差绝对值从未超过0.01 K。图3 (https://arxiv.org/html/2605.26130#S4.F3)中的空间图显示,AirCast-SR能够解析在GraphCast 28公里场中完全缺失的山谷冷池、湖泊效应温度梯度以及地形调节的热力对比。HRRR在非常短的预报时效上保持着边际逐点优势——一致

相似文章

AsymFlow宣称通过超越潜在扩散,生成更逼真的AI图像

Reddit r/ArtificialInteligence

AsymFlow是斯坦福大学提出的一种新方法,它将潜在扩散模型转换为像素空间,通过避免压缩带来的信息损失,生成更逼真的图像。在基准测试中,它以更低的计算成本超越了FLUX.2 klein。

极端降水降尺度的多分位数回归

arXiv cs.LG

介绍了Q-SRDRN,一种使用分位数损失的多分位数超分辨率网络,用于改进极端降水降尺度,在保持整体精度的同时,显著提高了强降雨事件的检测率。

简化、稳定和扩展连续时间一致性模型

OpenAI Blog

OpenAI 推出 sCM(简化连续时间一致性模型),这是一种新方法,可将一致性模型扩展至 1.5B 参数,通过仅 2 个采样步骤生成高质量样本,相比扩散模型实现约 50 倍的加速。该方法展示了与最先进扩散模型相当的样本质量,同时有效采样计算量不足 10%。