基于商用微波链路和扩散模型先验的贝叶斯雨场重建
摘要
本文提出了一种利用商用微波链路和扩散模型先验进行雨场重建的贝叶斯反问题框架,展示了其相对于现有基准方法的准确性提升。
arXiv:2605.05520v1 公告类型:新文章
摘要:商用微波链路(CMLs)为降雨监测提供了密集的空间覆盖,但其产生的路径积分测量值使得准确的地面重建面临挑战。现有方法通常将CMLs过度简化为点传感器,并忽略将降雨与信号衰减联系起来的线积分关系,导致在非均匀降水条件下性能下降。在本研究中,我们将雨场重建视为一个带有扩散模型(DMs)作为高保真空间先验的贝叶斯反问题。我们证明,与被审查的高斯过程相比,扩散模型能更好地保留关键的降雨统计特征。将降雨估计构建为带有扩散模型先验的贝叶斯反问题,使得可以使用包括即插即用(Plug-and-Play)、序贯蒙特卡洛(Sequential Monte Carlo)和副本交换(Replica Exchange)在内的多种方法进行无需训练的后验采样。在合成数据集和真实世界数据集上的实验表明,该方法始终优于现有的基于CML的重建基准。
查看缓存全文
缓存时间: 2026/05/08 07:49
# 利用商业微波链路和扩散模型先验进行贝叶斯雨场重建
来源: https://arxiv.org/html/2605.05520
Albina Ilina, Hai Victor Habi, Salem Lahlou, Yazid Janati, Hagit Messer, Eric Moulines
###### 摘要
商业微波链路(CMLs)为降雨感知提供了密集的空间覆盖,但其产生的路径积分测量使得准确的地面级重建具有挑战性。现有方法通常将 CMLs 简化为点传感器,并忽视将降雨与信号衰减联系起来的线积分特性,导致在非均匀降水条件下性能下降。在这项工作中,我们将雨场重建视为一个以扩散模型(DMs)作为高保真空间先验的贝叶斯逆问题。我们证明,与被截断的高斯过程相比,扩散模型能更好地保留关键的降雨统计特征。将降雨估计框架化为带有 DM 先验的贝叶斯逆问题,使得能够使用包括即插即用(Plug-and-Play)、序贯蒙特卡洛(Sequential Monte Carlo)和副本交换(Replica Exchange)在内的多种方法,无需训练即可进行后验采样。在合成和真实数据集上的实验表明,与既有的基于 CML 的重建基线相比,我们的方法取得了持续改进。机器学习,ICML
## 1 引言
准确的雨场数据对于水文学、洪水预警和水资源管理至关重要。标准传感技术依赖于雨量计(RGs)、天气雷达和卫星。雨量计准确但稀疏 (Messer et al., 2022)。天气雷达提供广泛覆盖,但需要校准,且对杂波和大气效应敏感 (Michelson and Koistinen, 2000; Krajewski and Smith, 2002; Harrison et al., 2000)。天气卫星将覆盖范围扩展到数据稀缺地区,但通常以牺牲分辨率换取覆盖范围 (Funk et al., 2014)。因此,没有单一模态能在大规模上提供密集、准确且经济实惠的降水监测。机会遥感通过重用现有基础设施来填补这一空白。特别是,蜂窝回传网络中的*商业微波链路*(CMLs)可以作为近地面雨水传感器 (Messer et al., 2006; Uijlenhoet et al., 2018; Graf et al., 2020, 2026)。
CML 形成了为电信目的部署的密集发射机和接收机网络。在降水期间,降雨会在网络每条链路路径 $\{\mathcal{L}_i\}_{i=1}^m$ 上引起衰减,这通常由经验幂律建模 (Leijnse et al., 2007; Eshe et al., 2021):
$$
Y_i = a \int_{\mathbf{s} \in \mathcal{L}_i} X(\mathbf{s})^b \, \mathrm{d}\mathcal{L}_i \; + \; \sigma_i Z_i, \quad Z_i \sim \mathcal{N}(0,1), \tag{1}
$$
其中 $X(\mathbf{s})$ 是降雨率 (mm/h),$a, b$ 是取决于链路特性的常数,而 $\sigma_i Z_i$ 是标准差为 $\sigma_i$ 的加性高斯噪声,独立于衰减 $Y_i$。
从 CML 重建雨场是一个逆问题:对于感兴趣的区域 $\Omega \subset \mathbb{R}^2$,给定衰减 $\{Y_i\}_{i=1}^m$,估计 $H \times W$ 域中的网格化场。该问题是病态的,因为测量值是路径积分且非线性的。许多重建方法将每条链路近似为*虚拟雨量计*(VRG),然后进行插值 (Shepard, 1968; Overeem et al., 2013; Goldshtein et al., 2009a; Eshe et al., 2021),这可能会丢弃宝贵的空间信息,并在非均匀降雨下性能下降。更复杂的变体,例如每条链路多个 VRG,仍然继承插值的局限性 (Goldshtein et al., 2009a)。
根本挑战在于,CML 测量提供了沿路径的聚合信息,而重建需要解决细尺度的空间结构。这种不匹配是病态逆问题的典型特征:无限多的雨场可以产生相同的观测值。通过先验知识进行正则化是必不可少的,但经典的選擇(如各向同性平滑或高斯空间模型)无法捕捉真实降水复杂、多尺度和间歇性的结构。
在这项工作中,我们将基于 CML 的雨场重建视为具有学习型生成先验的贝叶斯推断。最近的工作表明,深度生成模型,特别是*扩散模型*(DMs),为逆问题提供了强大的先验,并且可以通过推理时引导进行*免训练*的后验采样 (Dara et al., 2024; Janati et al., 2025b; Chung et al., 2023)。这种设置包括在代表性数据上离线训练 DM,然后在推理时将其作为先验重新使用,以正则化病态逆问题。
基于这一范式,我们做出以下贡献:
1. 我们表明,与被截断的高斯过程相比,DM 先验能产生高保真的空间雨场,并改善关键统计特征,例如累积降水量。
2. 我们利用免训练的后验采样,实现使用固定预训练 DM 的灵活推理,涵盖即插即用、序贯蒙特卡洛和副本交换方法。
3. 我们通过显式建模由经验幂律控制的非线性、路径积分 CML 算子,超越了 VRG 近似。我们在模拟和真实数据集上验证了该方法,并观察到相对于既定基线的持续增益。
据我们所知,这是第一项将带有扩散先验的后验采样应用于基于 CML 的机会式雨水传感的工作。
## 2 相关工作
CML 最初被提议作为机会式降雨传感器,其基础是雨致信号衰减与路径积分降雨强度之间基于物理的关系 (Messer et al., 2006)。CML 文献中的主导建模假设是将每个路径积分的 CML 测量简化为单个点观测,通常分配给链路中点,从而忽略沿链路路径的降雨变化。在这种抽象下,使用确定性的基于点的空间插值方法(如反距离加权(IDW)和普通克里金法(OK))重建降雨场 (Zhang et al., 2023; Blettner et al., 2022; Messer et al., 2022)。IDW 将网格位置的值估计为附近测量的加权平均值,权重随距离的幂次衰减,而 OK 利用二阶空间统计量,并通过变异函数模型从观测数据的空间相关结构中推导插值权重。虽然这些方法简单且计算高效,但将线积分测量坍缩为点估计本质上丢弃了包含在 CML 测量沿链路路径的线积分性质中的降雨变化信息。因此,重建的场往往过于平滑,无法重现细尺度的空间变异性和局部极端值。
为了缓解这一限制,Messer et al. (2022); Eshe et al. (2021) 提出了 Goldshtein-Messer-Zinevich (GMZ) 算法,其中使用多个 VRG 来近似路径积分测量。VRG 放置在链路沿线,其强度被迭代调整以确保与原始 CML 观测一致。虽然 GMZ 更好地表示了子链路变异性,但它最终仍停留在插值框架内,因为它依赖于伪点测量,而不是直接同化路径积分观测值。
更先进的随机重建方法 (Haese et al., 2017; Hörning et al., 2019; Blettner et al., 2022),例如随机混合(RM),考虑了 CML 测量的路径积分性质,并且与插值方法不同,它们对重建不确定性提供了严谨的处理。它将降水场生成无条件随机场的随机线性组合,以重现观测到的空间依赖结构。雨量计测量被强加点状约束,而 CML 观测值作为非线性、路径积分约束进入。在多个步骤中重复此过程会产生一组空间场,从而允许量化重建不确定性。然而,RM 依赖于生成和优化大量无条件随机场,计算成本高昂,特别是对于国家规模的应用。此外,它受到需要指定边缘降雨分布和空间依赖结构的限制。这使得它们依赖于雨量计,因为这些统计属性的可靠估计通常需要足够密集的雨量计网络。因此,这类方法不适合仅可用极少数量雨量计的情况,或者降雨信息几乎完全来自 CML 的用例。
在这项工作中,我们专注于仅使用 CML 测量进行雨场重建。我们在附录 A 中提供了关于确定性和随机性基于 CML 的重建方法的扩展讨论,包括随机混合框架和多传感器融合方法。
## 3 雨场先验模型
**图 1:** DM 先验生成的参考样本与生成样本之间的雨场统计比较。直方图显示密度,使用 5000 个样本构建。
**图 2:** 使用先验 DM 生成的雨场示例与参考雨场进行比较。总共生成了 5,000 个样本。在每个子图中,左侧样本从数据集中随机抽取;右侧样本从累积降雨量最高的 90% 湿润样本中抽取。
先验的选择对于正则化病态 CML 逆问题至关重要。我们比较两种建模方法:(i) 显式编码空间相关性和非负性等降雨特性的被截断高斯过程,以及 (ii) 直接从数据中学习这些特性的扩散模型。
### 3.1 被截断高斯过程
降雨强度场本质上是间歇性的:它们将频繁的无降水事件与高度偏斜的正强度相结合,如图 1 所示。关于随机降水建模和地球统计重建存在丰富的文献 (Wilks and Wilby, 1999; Wheater et al., 2000; Yang et al., 2005)。一种经典且广泛使用的统计抽象通过一个在零处左截断的潜在高斯过程来模拟这种混合行为 (Bardossy and Plate, 1992)。早期框架 (Bardossy and Plate, 1992; Ailliot et al., 2009) 通过潜在高斯随机场表示空间依赖性,并通过截断强制非负性,通常与幂变换一起使用,以更好地匹配正降雨率的重右尾。后续工作通过引入更复杂的被截断潜在过程的变换来完善这些思想,以增加灵活性,同时保留分析和计算便利性 (Baxevani and Lennartsson, 2015; Stauffer et al., 2017)。
尽管具有实用吸引力,但被截断高斯过程(GP)先验仍受限于高斯核的结构。特别是,基于高斯的核倾向于产生相对*僵硬*的先验:它们可能难以重现雨场中常见的尖锐梯度、多尺度变异性和非平稳空间组织。此外,当这些模型在贝叶斯逆问题中用作先验时,推理可能变得计算量大。截断操作引入了不等式约束,并要求处理高维截断或被截断的高斯分布,这进而涉及禁止性的采样程序 (Pakman and Paninski, 2014; Botev, 2017)。
我们采用以下被截断 GP 模型作为经典基线先验。雨场 $X$ 定义在 $H \times W$ 网格上,并从潜在高斯随机场 $V$ 构建。具体而言,我们假设 $V \sim \mathcal{GP}(\mu, k)$,其中 $\mu: \mathbb{R}^2 \rightarrow \mathbb{R}$。为了适应各向异性,我们使用由正定矩阵 $\mathbf{Q} \in \mathbb{R}^{2 \times 2}$ 参数化的平稳核:
$$
k(\mathbf{s}, \mathbf{s}') = \sigma^2 \exp\left(-\frac{1}{2}(\mathbf{s} - \mathbf{s}')^\top \mathbf{Q} (\mathbf{s} - \mathbf{s}')\right),
$$
其中 $\mathbf{s}, \mathbf{s}' \in \mathbb{R}^2$。观测到的雨场随后通过幂变换并在零处截断获得:
$$
X(\mathbf{s}) = \max\big(0, V(\mathbf{s})^\beta\big), \quad \mathrm{for}\; \; \mathbf{s} \in \mathbb{R}^2,
$$
这在零处诱导点质量,同时具有偏斜的正分量。参数 $\beta$ 控制正强度中的偏度程度,而 $\mathbf{Q}$ 和 $\sigma$ 分别控制空间相关结构和边缘尺度。该模型由 $(\mu, \mathbf{Q}, \sigma, \beta)$ 参数化。期望最大化算法 (Ordoñez et al., 2018) 用于估计模型参数 $(\mu, \mathbf{Q}, \sigma, \beta)$,它将潜在场 $V$ 视为缺失数据,并在推理过程中考虑截断机制;细节见附录 F。
### 3.2 扩散模型
设 $x_0 \sim p_0$ 表示来自数据分布的样本。我们采用由固定递增噪声计划 $0 = \sigma_0 < \sigma_1 < \cdots$ 定义的扩散模型的*方差爆炸*(VE) formulation...相似文章
空间支撑至关重要:几何感知图融合用于降雨场重建
本文提出了一种几何感知的多支撑异构图神经网络,用于精细尺度降雨场重建,融合了点雨量计、路径积分微波链路以及格点雷达/卫星数据的观测。该方法在新加坡数据上相比经典插值方法将RMSE降低了23.2%,并且当降雨场相对于其空间相关长度欠采样时,其增益最为显著。
(HB-ARFM) 历史引导的逆向沸腾重构流匹配方法
本文提出了一种历史引导的自回归流匹配方法,用于从沸腾动力学部分观测中重构完整的时空场(速度和温度),解决了非马尔可夫后验下的不适定逆问题。
EO-WM:一种物理信息驱动的概率地球观测预测世界模型
EO-WM提出了一种视频扩散变换器,用于概率性地球观测预测,该模型融入了物理信息条件,以捕捉天气驱动的不确定性,从而在极端天气下实现了对植被指数的更好预测。
克服地球观测中的“Physics Shock”:一种用于基于PINN的洪水推理的异方差不确定性框架
本文介绍了一种新颖的不确定性感知PINN框架,用于从SAR数据进行洪水推理,通过动态放松噪声区域的物理约束来解决“物理冲击”问题。在Sen1Floods11数据集上评估,该方法实现了IoU提高25%,并为操作化灾害响应提供了校准的不确定性边界。
线性约束下的条件扩散:Langevin 混合与信息论保证
本文分析了预训练扩散模型在线性逆问题上的零样本条件采样,提供了信息论保证并提出了一种投影 Langevin 初始化方法。