极端降水降尺度的多分位数回归

arXiv cs.LG 论文

摘要

介绍了Q-SRDRN,一种使用分位数损失的多分位数超分辨率网络,用于改进极端降水降尺度,在保持整体精度的同时,显著提高了强降雨事件的检测率。

arXiv:2605.12762v1 公告类型: 新 摘要: 用于降水降尺度的深度超分辨率网络在整体技能上表现强劲,但系统性地低估了导致洪水风险的厚尾事件。我们证明主要障碍在于损失函数,而非数据:在强度加权平均绝对误差(MAE)下,相同输入的真实标签和合成标签只是简单平均,这意味着数据增强改变的是预测均值而非条件分布。我们通过Q-SRDRN解决了这一问题,这是一种多分位数超分辨率网络,使用τ取0.50、0.95、0.99、0.999的分位数损失进行训练。两个特定的CNN设计使其切实可行:IncrementBound在保持每个分位数通道梯度同一性的同时强制单调性,单独的分位数输出头为整体和尾部检测提供独立的滤波器组。在这种设计下,通过cVAE进行的数据增强变得互补:中位数头吸收合成模式而不污染上分位数。在佛罗里达州(以对流/热带气旋为主)的实验表明,未增强的Q-SRDRN P999头在200毫米/天的阈值下检测到2,111个事件中的1,598个,而确定性基线仅检测到88个——检测率提升了18倍(从4.2%提升至75.7%),同时KL散度降低了63%,RMSE降低了3.9%。添加cVAE生成的样本后,P50通道在200毫米/天阈值下的命中数从14提升至1,038。在加利福尼亚州(以大气河流为主),该架构达到了近乎完美的检测(300毫米/天内P999 SEDI >= 0.996)。在得克萨斯州,基线在200毫米/天阈值下仅捕获10,720个事件中的2个,而P999头捕获了8,776个(81.9%)。虽然cVAE无法跨区域迁移,但多分位数回归能够在大尺度信号强烈的区域捕捉极端事件,而在信号较弱时,数据增强则拯救中位数。
查看原文
查看缓存全文

缓存时间: 2026/05/14 06:18

# 极端降水降尺度的多分位数回归  
**来源:** https://arxiv.org/html/2605.12762  

**Hamed Najafi**  
佛罗里达国际大学,迈阿密,佛罗里达州  
hnaja002@fiu\.edu  

**Gareth Lagerwall**  
Everglade 基金会,迈阿密,佛罗里达州  
glagerwall@evergladesfoundation\.org  

**Jayantha Obeysekera**  
佛罗里达国际大学,迈阿密,佛罗里达州  
jobeysek@fiu\.edu  

**Jason Liu**  
佛罗里达国际大学,迈阿密,佛罗里达州  
liux@fiu\.edu  

###### 摘要  

用于降水降尺度的深度超分辨率网络在整体技巧上表现出色,但系统地低估了驱动洪水风险的尾部重事件。自然的补救措施——用合成极端事件增强训练——却毫无成效。我们认为障碍在于损失函数,而非数据:在强度加权MAE下,真实标签和合成标签在相同输入下被简单平均,因此数据增强会移动预测均值而非条件分布。我们通过 Q-srdrn 解决此问题,这是一个多分位数超分辨率网络,使用 **τ∈{0.50,0.95,0.99,0.999}** 的弹球损失进行训练。两个特定于CNN的设计选择使其实用:*IncrementBound* 在保持每个分位数通道梯度同一性的同时强制执行单调性,而分离的每个分位数输出头使得整体和尾部检测器拥有独立的滤波器组。在此设计下,数据增强(cvae)变得互补而非有害:中位数头吸收了合成的极端模式,而不会污染上分位数。实验上,在佛罗里达(对流、热带气旋主导)地区,未增强的 Q-srdrn 的 P999 头在 200 mm/天 处检测到 2,111 个事件中的 1,598 个,而确定性基线仅检测到 88 个——检测率提升 18 倍(4.2% → 75.7%),KL 散度降低 63%,RMSE 降低 3.9%。此外,83 个 cvae 生成的样本将 P50 通道在 200 mm/天 处的命中数从 14 提升到 1,038(74 倍)。在加利福尼亚(大气河主导)地区,仅架构本身即可达到近乎完美的检测(P999 SEDI ≥ 0.996 直至 300 mm/天)。在得克萨斯州子区域,架构本身的效果更加显著:确定性基线在 200 mm/天 处仅捕获 22 个事件中的 10,720 个,而 P999 头捕获了 8,776 个(81.9%)。有趣的是,在佛罗里达调优的 cvae 并不能迁移到加利福尼亚或得克萨斯州子区域,这揭示了增强本身是一个区域特定的组件。多分位数回归能够在大尺度信号强的任何地方捕获极端事件;而 cvae 增强,当其架构与气候态匹配时,则能在信号不强的地方挽救中位数。  

## 1 引言  

降水降尺度将粗分辨率再分析场映射到高分辨率观测,是洪水风险建模、基础设施规划和业务水文学的常规输入。现代超分辨率网络很好地匹配了观测降水分布的整体(Vandal et al., 2017 (https://arxiv.org/html/2605.12762#bib.bib26); Sha et al., 2020 (https://arxiv.org/html/2605.12762#bib.bib24); Wang et al., 2021 (https://arxiv.org/html/2605.12762#bib.bib28)),但其预测在最严重的极端事件上系统性退化,而这些事件对下游风险最为关键。在佛罗里达 ERA5/PRISM 数据上,一个最先进的确定性基线(Wang et al., 2021 (https://arxiv.org/html/2605.12762#bib.bib28))将气候态均值高估了 43%(5.94 对比 4.14 mm/天),同时仅检测到 2,111 个观测事件中 88 个 ≥200 mm/天 的事件(检测概率 POD 为 4.2%)。教科书式的修复——使用生成模型生成的合成极端事件扩大训练集——同样失败:随着增强增大,性能反而下降而非提升。  

失败是损失函数而非数据本身的属性。强度加权 MAE 收敛于加权条件中位数(Koenker and Hallock,2001 (https://arxiv.org/html/2605.12762#bib.bib14)):在一个 99% 的天数都是轻降水的像素上,最优预测接近整体均值,而合成极端事件仅仅被平均到中位数中。自然的替代方案是弹球损失多分位数回归(Koenker and Hallock,2001 (https://arxiv.org/html/2605.12762#bib.bib14); Bremnes,2004 (https://arxiv.org/html/2605.12762#bib.bib4)),它为每个分位数水平分配一个输出,并对低估的惩罚比重估重 τ/(1−τ) 倍(在 τ=0.999 时不对称性为 999 倍)。必须同时解决两个特定于 CNN 的障碍:逐像素排序(教科书式的非交叉修复)会打乱每个输出通道的梯度同一性,使得卷积滤波器无法专门化;而共享的 Conv2D(4) 输出层迫使整体和尾部检测器竞争相同的滤波器组。我们通过 *IncrementBound*(一种累积的 softplus 构造,将每个输出通道固定到特定分位数)结合 *分离的* Conv2D(1) 头来解决这两个问题。一个意想不到的好处是,P50 头使用未加权的弹球损失训练收敛于真实条件中位数,并且对少量合成极端样本具有鲁棒性——因此多分位数回归和增强,本应孤立正交,却变得互补。  

我们在三个美国区域进行验证:佛罗里达(对流、热带气旋)、加利福尼亚(大气河)以及得克萨斯湾海岸子区域(混合对流/热带气旋登陆)。cvae 增强仅在佛罗里达报告,因为同一个 FL 调优的生成器架构轻微损害了加利福尼亚的 P50 通道,因此未在得克萨斯州子区域运行——这一发现我们作为关于增强的区域特定性的单独结果处理。(§4.5 (https://arxiv.org/html/2605.12762#S4.SS5))。总体而言,我们的贡献有三方面:  

**首先**,我们识别了基于排序的分位数单调性在 CNN 中特有的失败模式——逐像素排列破坏空间滤波器专门化——并通过 Q-srdrn 解决,该网络结合了 IncrementBound 与分离的 Conv2D(1) 头。在没有任何增强的情况下,佛罗里达 200 mm/天 处的 P999 检测从 4.2% POD(88 个事件)提升至 75.7% POD(1,598 个事件)。  

**其次**,我们在三个气候不同的区域验证了相同的架构和超参数。在加利福尼亚(大气河主导)区域,未增强的架构在直到 300 mm/天 的每个阈值下均达到 P999 SEDI ≥ 0.996;在得克萨斯州子区域,未增强的 P999 头在 200 mm/天 处捕获了 10,720 个事件中的 8,776 个(81.9%,确定性基线为 0.02%),在 300 mm/天 处捕获了 2,265 个中的 1,441 个。  

**最后**,我们表明多分位数回归正是使 cvae 增强在佛罗里达变得有用的关键:在弹球损失下,中位数受到保护,免受污染 MAE 训练网络的标签平均效应的影响,从而将佛罗里达 P50 在 200 mm/天 处的 SEDI 从 0.405 提升至 0.866,并将 KL 散度降低 50%。  

## 2 相关工作  

**统计和基于学习的降尺度。** 统计降尺度器——偏差校正和空间降聚合(Wood et al., 2004 (https://arxiv.org/html/2605.12762#bib.bib27))、广义线性模型(Chandler and Wheater,2002 (https://arxiv.org/html/2605.12762#bib.bib7))和相似方法(Zorita and von Storch,1999 (https://arxiv.org/html/2605.12762#bib.bib30))——在构造上是校准的,但无法利用高维再分析场。深度学习方法,包括 CNN(Vandal et al.,2017 (https://arxiv.org/html/2605.12762#bib.bib26); Baño-Medina et al.,2020 (https://arxiv.org/html/2605.12762#bib.bib1))、超分辨率残差网络(Wang et al.,2021 (https://arxiv.org/html/2605.12762#bib.bib28))和 U-Net(Sha et al.,2020 (https://arxiv.org/html/2605.12762#bib.bib24)),大幅提升了整体技能,但继承了其训练目标的均值偏向——无论是逐像素的 MAE/MSE 点损失,还是期望值参数似然(例如 Baño-Medina et al.,2020 (https://arxiv.org/html/2605.12762#bib.bib1) 中用于降水的伯努利-伽马负对数似然)——这正是本文所诊断的失败模式。随机扩展通过采样而非改变损失来规避均值偏向:GAN(Harris et al.,2022 (https://arxiv.org/html/2605.12762#bib.bib12); Price and Rasp,2022 (https://arxiv.org/html/2605.12762#bib.bib21))生成集成样本,而基于扩散的采样器——无论是用于千米级区域降尺度(CorrDiff (Mardani et al.,2025 (https://arxiv.org/html/2605.12762#bib.bib17)), 22 公里台湾),还是全球集合预报(GenCast (Price et al.,2025 (https://arxiv.org/html/2605.12762#bib.bib22)), 0.25° 经纬度)——以每次实现需要迭代多步生成过程为代价(CorrDiff 大约 12 次去噪迭代,GenCast 每个时间步 39 次网络评估),将集合采样扩展为校准的概率分布。基础尺度天气模型(Pathak et al.,2022 (https://arxiv.org/html/2605.12762#bib.bib20); Bi et al.,2023 (https://arxiv.org/html/2605.12762#bib.bib2); Nguyen et al.,2023 (https://arxiv.org/html/2605.12762#bib.bib19))针对全球预报,在范围上是互补的。Q-srdrn 与基于采样的系列不同,它替换了损失函数:一次前向传播即可在每个像素返回校准的离散 CDF,包括专用的极端尾部分位数。  

**分位数回归和单调网络。** 弹球损失分位数回归用于降水已有悠久历史(Bremnes,2004 (https://arxiv.org/html/2605.12762#bib.bib4); Cannon,2011 (https://arxiv.org/html/2605.12762#bib.bib5))。非交叉已通过多种机制强制实现:连续分位数头之间的累积 softplus 增量(Cannon,2018 (https://arxiv.org/html/2605.12762#bib.bib6))、由正权重或积分正函数构建的结构单调前馈网络(Daniels and Velikova,2010 (https://arxiv.org/html/2605.12762#bib.bib8); Wehenkel and Louppe,2019 (https://arxiv.org/html/2605.12762#bib.bib29); Brando et al.,2022 (https://arxiv.org/html/2605.12762#bib.bib3)),以及循环预报器内部受约束的分位数增量(Liu et al.,2023 (https://arxiv.org/html/2605.12762#bib.bib16))。这些方法均假设输出单元与分位数之间一一对应,这在全连接和循环解码器中成立,但在空间 CNN 中失效,因为单个卷积滤波器在每个像素处被重用。我们诊断了由此产生的 CNN 特定失败模式——逐像素排序排列打乱了每个通道的梯度同一性(第 4.3 节)——并通过 IncrementBound 结合分离的 Conv2D(1) 输出头解决,这共同保持了固定的梯度到通道的路由。基于采样的不确定性估计器(Gal and Ghahramani,2016 (https://arxiv.org/html/2605.12762#bib.bib10); Lakshminarayanan et al.,2017 (https://arxiv.org/html/2605.12762#bib.bib15); Vandal et al.,2018 (https://arxiv.org/html/2605.12762#bib.bib18))是一种概率替代方案,但正如我们的比较所示(§4.4 (https://arxiv.org/html/2605.12762#S4.SS4)),它们在降水尾部坍缩为分位数不变的预测方差。  

**不平衡地球物理数据的数据增强。** 变分自编码器(Kingma and Welling,2014 (https://arxiv.org/html/2605.12762#bib.bib13))及其条件扩展(Sohn et al.,2015 (https://arxiv.org/html/2605.12762#bib.bib25)),以及 GAN,已被用于合成天气场(Ravuri et al.,2021 (https://arxiv.org/html/2605.12762#bib.bib23)),但使用此类样本增强训练集以解决降水尾部代表性不足的问题仍未得到充分探索。现有工作将生成器视为独立于监督损失的即插即用数据源。我们表明,增强样本与损失函数之间的*交互*——而非合成样本的质量——决定了增强是有益还是有害:同一个 cvae 样本,会破坏 MAE 训练网络的稳定性,却能被校准的多分位数预测器吸收而不污染上分位数头。因此,架构和增强是不可分割的:前者决定了后者是有益还是有害。  

## 3 方法  

### 3.1 问题设定  

**表1:** 三个研究域共享相同的 15 个 ERA5 输入变量,训练天数约为 12,400 天(1980–2013)。得克萨斯州子区域覆盖一个 6°×6° 的湾海岸盒子(28–34°N, 98–92°W)。  

我们将每日 ERA5 再分析数据(约 25 km 分辨率)降尺度到 PRISM 降水(约 4 km 分辨率)。设 **x ∈ R^{C×H×W}** 为粗分辨率输入,包含 C=15 个 ERA5 通道:2 米温度及其日极值和土壤温度(t2m, mx2t, mn2t, stl1);10 米风(u10, v10);降水总量及其日极值(tp, cp, mxtpr, mntpr);三层云量(lcc, tcc, hcc);以及地表径流和蒸发(sro, e)。设 **y ∈ R_{≥0}^{H′×W′}** 为细分辨率 PRISM 目标。陆地掩膜 **m ∈ {0,1}^{H′×W′}** 将损失和评估限制在 **N_land = Σ_{h,w} m_{h,w}** 个陆地上像素。确定性降尺度器返回单一的点估计 **ŷ_{h,w}**;我们转而预测每个像素的离散条件 CDF,包含四个分位数估计 **q̂_{τ,h,w}**,其中 **τ ∈ T = {0.50, 0.95, 0.99, 0.999}**。表1概述了三个研究域,它们共享相同的输入变量和训练期,但在极端降水气候态上差异显著。

### 3.2 SRDRN 骨干网络

本文所有模型共享同一个特征提取器:**srdrn**(Wang et al., 2021),一个卷积超分辨率网络。该网络将 **x** 双线性上采样到 PRISM 网格,通过 16 个带有 SpatialDropout2D 的残差块进行细化,并通过非对称像素重组上采样恢复细尺度细节;我们将得到的逐像素特征图称为 *共享骨干特征*。确定性基线通过单个 9×9 Conv2D(1) 头将这些特征映射到 **ŷ**,并使用强度加权 MAE 进行训练:**w = clip(y/11.7, 0.1, 2.0)**,其中 11.7 mm/天是训练集湿日降水的标准差,权重在 **y=23.4** mm/天处饱和。Q-srdrn 原封不动地重用该骨干,仅替换输出头和损失函数;因此任何性能差异均可归因于分位数设计,而非特征提取。

### 3.3 Q-SRDRN:多分位数回归

将确定性头转变为多分位数预测器暴露了四个耦合问题:(1) 非对称的逐分位数损失;(2) 尽管极端天出现率约 1%,上尾部仍需要足够的梯度信号;(3) 在 **τ** 上的非交叉单调性不能破坏 CNN 中空间滤波器的专门化;(4) 逐通道梯度路由,使得中位数和 P999 检测器不相互竞争。

**(1) 弹球损失。** 对于分位数 **τ** 和残差 **e = y - q̂_τ**,弹球损失(Koenker and Hallock,2001; Bremnes,2004)**ρ_τ(e) = max(τe, (τ-1)e)**  对低估的惩罚比重估重 **τ/(1-τ)** 倍(在 **τ=0.99** 时为 99 倍)

相似文章

面向分布强化学习的分位数几何正则化

arXiv cs.LG

本文介绍了 RQIQN,这是一种基于分位数的分布强化学习鲁棒方法,利用 Wasserstein 几何正则化来防止分布退化,并提升在风险敏感任务中的性能。

用于样本高效连续控制的无偏模型化表示

Hugging Face Daily Papers

本文介绍了 DR.Q 算法,该算法通过最大化互信息并采用淡出优先经验回放,改善了 Q-learning 的模型化表示,从而减少了连续控制任务中的偏差和过拟合。