物理信息机器学习用于短期洪水预测

arXiv cs.LG 2026/06/04 04:00 论文

physics-informed-ml flood-prediction lstm hydrology deep-learning climate geoscience

摘要

研究人员提出了一种物理信息机器学习（PIML）框架，将水文约束整合到LSTM损失函数中，以改善短期洪水预报，特别是在数据稀缺的情况下。一种“趋势对齐”约束确保了降水与流量趋势之间的一致性，提高了纳什-苏特克利夫效率，并消除了极端事件期间的非物理预测。

arXiv:2606.04143v1 公告类型：新摘要：准确的洪水预报对于减轻灾害风险和保护社区至关重要。然而，纯粹的数据驱动机器学习模型在数据稀缺环境中往往表现不佳，并可能违反基本的水文原理。标准的长时间短期记忆（LSTM）网络可能产生物理上不一致的预测，尤其是在外推到极端天气条件时。为了解决这些限制，我们提出了一种物理信息机器学习（PIML）框架，将水文知识直接纳入LSTM模型的损失函数中。具体来说，一种“趋势对齐”约束惩罚降水与流量趋势之间的方向不一致性，从而在不要求复杂水动力学方程的情况下提高模型鲁棒性。这种正则化鼓励模型即使在使用有限训练数据时也能学习物理上合理的水文曲线行为，同时增强峰值洪水事件期间的可靠性。实验结果表明，所提出的物理信息模型在数据稀缺环境下优于标准LSTM基线，当仅使用可用数据的5%进行训练时，纳什-苏特克利夫效率（NSE）从0.20提高到0.23。在模拟极端气候场景下的额外压力测试表明，基线模型表现出不稳定行为，而物理信息模型保持了方向一致性和物理合理性。尽管在数据有限的情况下准确预测极端峰值幅度仍然具有挑战性，但所提出的方法大幅减少了纯数据驱动模型中常见的非物理波动。这些发现表明，简单的物理约束可以显著提高用于实时洪水预报的深度学习模型的可靠性，为无测站流域和不断变化的气候条件提供了实用的解决方案。

查看原文

查看缓存全文

缓存时间: 2026/06/05 02:21

# 物理信息机器学习用于短期洪水预测

本研究论文部分得益于微软加速基础模型学术研究计划(AFMR)的支持，以及美国国家科学基金会(NSF)资助项目(编号2401942)的支持。版权所有2026 IEEE。发表于2026 IEEE国际地球科学与遥感研讨会(IGARSS 2026)，会议将于2026年8月9–14日在华盛顿特区举行。允许个人使用本材料。然而，如需重印/再版本材料用于广告或促销目的，或用于创建新的集体作品以转售或重新分发到服务器或列表，或在本作品中重用任何受版权保护的组件，必须获得IEEE许可。联系人：版权与许可经理 / IEEE服务中心 / 445 Hoes Lane / P.O. Box 1331
来源：https://arxiv.org/html/2606.04143

###### 摘要

准确的洪水预报对于减轻灾害风险和确保公共安全至关重要，然而纯粹数据驱动的机器学习模型在数据匮乏的情况下往往缺乏可靠性，并且无法遵循基本的水文原理。标准的LSTM网络虽然强大，但可能会产生物理上不一致的预测，特别是在外推到未见过的极端天气事件时。为了解决这些局限性，我们提出了一种物理信息机器学习(PIML)框架，该框架将水文约束直接集成到LSTM网络的损失函数中。具体来说，我们证明了实施“趋势对齐”约束——惩罚降水与流量趋势之间的方向不一致——显著增强了模型的鲁棒性，而无需复杂的流体动力学方程。这种方法有效地正则化模型，引导其学习物理上合理的水文过程线形状，即使在训练数据严重有限的情况下也是如此，特别关注提高洪峰事件的可靠性。我们的实验表明，在数据匮乏的环境中，物理信息模型优于标准基线模型，当仅使用5%的可用数据训练时，纳什-萨特克利夫效率(NSE)从0.20提高到0.23。此外，模拟极端气候情景的压力测试表明，基线模型表现出异常行为，而物理约束模型保持了方向一致性和物理合理性。尽管在稀疏数据情况下捕捉极端峰值的精确幅度仍然是一个挑战，但所提出的方法成功消除了纯数据驱动方法中出现的非物理波动。这项研究确立了简单、有针对性的物理约束可以将标准深度学习模型转化为可靠的实时洪水预报工具，为无资料流域和气候变化提供了稳健的解决方案。

## I. 引言

洪水是世界上最具破坏性的自然灾害之一，约占所有自然灾害的40%，每年造成的损失估计超过1000亿美元[5 (https://arxiv.org/html/2606.04143#bib.bib41),6 (https://arxiv.org/html/2606.04143#bib.bib42)]。准确、实时的河流流量预测对于早期预警系统至关重要，可以显著减轻这些经济损失并保护人类生命。然而，虽然像机器学习这样的纯数据驱动方法已经变得无处不在，但它们从根本上缺乏物理基础，往往在训练数据稀少的关键极端事件期间导致不可靠或物理上不一致的预测。

长短期记忆(LSTM)网络和其他深度学习架构为降雨-径流建模设立了新的基准，但它们在数据匮乏区域、无资料流域以及洪峰水位期间表现显著不佳。因为这些模型仅优化统计相关性而非水文因果关系，它们经常违反基本物理定律，例如降水与径流之间的单调关系，导致在外推到训练分布之外时产生异常的预测[14 (https://arxiv.org/html/2606.04143#bib.bib43),3 (https://arxiv.org/html/2606.04143#bib.bib28),10 (https://arxiv.org/html/2606.04143#bib.bib44)]。因此，迫切需要既能利用深度学习预测能力，又严格遵循基本水文原理的方法[1 (https://arxiv.org/html/2606.04143#bib.bib29),2 (https://arxiv.org/html/2606.04143#bib.bib21),4 (https://arxiv.org/html/2606.04143#bib.bib25)]。

本研究引入了一个轻量级的物理信息机器学习(PIML)框架，将简单的“趋势对齐”约束直接集成到LSTM损失函数中，以指导模型学习。我们证明了这种有针对性的物理正则化使模型能够超越传统机器学习方法，特别是在数据有限的环境和合成极端气候压力测试中。通过优先考虑方向一致性和时间平滑性而非复杂的流体动力学方程，我们的方法为可靠的实时洪水预报提供了一种实用、可扩展且稳健的解决方案。

## II. 相关工作

数据驱动模型，特别是长短期记忆(LSTM)网络，已被用于降雨-径流建模，因为它们能够捕捉流域动态中的长期时间依赖性以及其他应用[11 (https://arxiv.org/html/2606.04143#bib.bib38),8 (https://arxiv.org/html/2606.04143#bib.bib20)]。虽然这些模型在标准基准上表现令人印象深刻，但它们通常作为“黑箱”运行，未能整合基本的水文原理。这种物理基础的缺乏可能导致物理上不一致的预测，例如违反质量守恒或产生不切实际的流量波动，尤其是在应用于数据匮乏的流域或极端事件时[12 (https://arxiv.org/html/2606.04143#bib.bib39)]。此外，基于LSTM的模型在数据有限的区域容易过拟合，这加剧了水文预报中的这些问题。

物理信息机器学习(PIML)范式已成功应用于流体动力学和材料科学等领域，通过将偏微分方程(PDE)嵌入神经网络损失函数中[12 (https://arxiv.org/html/2606.04143#bib.bib39),9 (https://arxiv.org/html/2606.04143#bib.bib35),13 (https://arxiv.org/html/2606.04143#bib.bib40),7 (https://arxiv.org/html/2606.04143#bib.bib30)]。在水文学中，最近的工作将深度学习与基于过程的模型相结合，但这些方法通常会引入显著的计算复杂性，需要求解既耗费资源又耗时的偏微分方程。相比之下，我们的方法证明了实施简单、高级别的约束，如趋势对齐和时间平滑性，提供了一种轻量级、有效的机制来确保物理合理性，而无需显式的流体动力学解。这使得我们的方法不仅在计算上更高效，而且在实际洪水预报系统中更容易实现。

## III. 方法论

我们使用了CAMELS-US数据集的一个子集(流域01022500)，包含跨越多年期间的日时间序列降水与流量记录。数据使用Min-Max缩放进行归一化处理，并生成具有30天回顾窗口的序列，以捕捉LSTM模型的前期流域状况(见图1 (https://arxiv.org/html/2606.04143#S3.F1))。

请参见图注

图1：使用物理信息LSTM模型进行流量预测的所提方法论流程图。流程包括数据集预处理、模型训练(基线LSTM与物理信息LSTM)、损失函数组件和优化过程。

LSTM 作为基线，我们有意识地采用了一个标准的长短期记忆(LSTM)网络。虽然存在更复杂的架构，但标准LSTM作为一个高度可控的基线，使我们能够隔离并量化仅归因于物理信息损失函数的特定性能提升，而不受高级架构修改的混淆变量影响。基线模型经过训练，以最小化预测流量与观测流量之间的均方误差(MSE)，仅依赖训练数据中的统计相关性，没有显式的物理约束。

物理信息LSTM 我们提出的框架通过复合损失函数将水文原理直接集成到训练目标中，从而增强了标准LSTM。我们不是求解复杂的偏微分方程，而是通过软约束来实施高层次物理一致性：趋势对齐，惩罚降水输入与流量趋势之间的方向不一致(确保降雨导致水位上升)；时间平滑性，抑制水文过程线中不切实际的高频波动。

物理信息损失 总损失函数将标准数据保真项(MSE)与物理违反的加权惩罚项相结合。具体来说，趋势对齐项\( L_{trend} \)强制要求时间\( t \)的正降水事件与短滞后窗口(\( k=3 \))内流量的非负趋势相关，而平滑性项\( L_{smooth} \)惩罚连续时间步之间的突变，共同引导模型在洪峰事件期间做出物理上合理的预测。

### 数学框架与优化过程

#### III-1 问题形式化

令\(\mathcal{D}=\{(X_i, y_i)\}_{i=1}^{N}\)表示数据集，其中\(X_i \in \mathbb{R}^{T \times F}\)是长度为\(T\)、具有\(F\)个特征(降水)的输入序列，\(y_i \in \mathbb{R}\)是最后一个时间步的目标流量。模型\(f_\theta\)由参数\(\theta\)参数化，将输入映射到预测流量：\(\hat{y}_i = f_\theta(X_i)\)。

#### III-2 损失函数组件

为了强制物理一致性，训练目标最小化由三项组成的复合损失函数\(\mathcal{L}_{\text{total}}\)：

数据保真项(MSE)：标准监督，匹配观测流量：
\[
\mathcal{L}_{\text{data}} = \frac{1}{N}\sum_{i=1}^{N}(\hat{y}_i - y_i)^2
\]

趋势对齐约束(物理)：确保流量的方向变化与滞后窗口\(K=3\)内降水的存在相匹配。如果下雨(\(r_t > 0\))，流量不应减少：
\[
\mathcal{L}_{\text{trend}} = \frac{1}{N}\sum_{i=1}^{N}\max\left(0,\; -\text{sign}(r_t)\cdot(\hat{y}_{t+K} - \hat{y}_t)\right)
\]

时间平滑性约束：正则化高频噪声，确保切合实际的水文过程线形状：
\[
\mathcal{L}_{\text{smooth}} = \frac{1}{N}\sum_{i=2}^{N}(\hat{y}_t - \hat{y}_{t-1})^2
\]

#### III-3 优化过程

我们采用基于梯度的优化策略，步骤包括：

1. 初始化：初始化LSTM参数\(\theta \sim \mathcal{N}(0,\sigma^2)\)。
2. 前向传播：对于每个批次\(B\)：
   - • 计算预测：\(\hat{Y} = \text{LSTM}_\theta(X)\)
   - • 提取对应的降水输入\(R\)。
3. 损失计算：
   - • 计算数据损失：\(\mathcal{L}_{\text{data}}(\hat{Y}, Y)\)
   - • 计算物理惩罚：\(\mathcal{L}_{\text{trend}}(\hat{Y}, R)\)和\(\mathcal{L}_{\text{smooth}}(\hat{Y})\)
   - • 聚合：\(\mathcal{L}_{\text{total}} = \mathcal{L}_{\text{data}} + 0.1 \cdot \mathcal{L}_{\text{trend}} + 0.01 \cdot \mathcal{L}_{\text{smooth}}\)
4. 反向传播：计算梯度\(\nabla_\theta \mathcal{L}_{\text{total}}\)。
5. 参数更新：使用Adam优化器更新权重：\(\theta \leftarrow \theta - \eta \cdot \nabla_\theta \mathcal{L}_{\text{total}}\)。

## IV. 实验与结果

### IV-A 评估设置

为了严格评估所提出的物理信息LSTM，我们将CAMELS-US数据集按时间顺序划分为80/20的训练集和测试集。模型性能通过均方根误差(RMSE)评估全局准确性，并使用纳什-萨特克利夫效率(NSE)量化水文技能。关键的是，我们引入了一个**峰值事件MAPE**指标，专门计算前5%流量事件的平均绝对百分比误差，以评估关键洪水期间的可靠性。我们还进行了一个**“数据稀缺”**实验，仅使用5%的数据进行训练，以及一个**“压力测试”**，通过人为加倍降水输入来模拟极端气候情景。

### IV-B 性能比较

标准情景(完整数据)：在完整数据集上，物理信息模型(利用趋势对齐约束)略微优于基线LSTM。物理模型的NSE为0.2558，而基线为0.2441，并将RMSE从4.1410 mm/d降低到4.1090 mm/d。在极端事件方面，物理模型的峰值MAPE略有改善(39.73%对比39.97%)，表明软物理约束不会阻碍，并且可以略微增强模型捕捉高流量动态的能力。

数据稀缺情景(5%数据)：物理信息方法的优势在数据有限的实验中最为明显。当仅使用78个样本(5%的数据)进行训练时，基线模型的性能显著下降，NSE为0.2037。相比之下，物理信息模型保持了稳健的NSE为0.2321。这表明，当历史数据不足以学习统计相关性时，嵌入的物理定律充当了关键正则化器，引导模型走向合理的解。

请参见图注

图2：使用NSE(纳什-萨特克利夫效率)值进行模型性能的鲁棒性评估。左侧柱状图显示了完整数据集上基线模型与物理信息模型的性能，右侧柱状图显示了仅使用5%数据集时的性能。

请参见图注

图3：加倍降水条件下模型性能的极端气候压力测试结果。图中显示了随时间变化的流量率，比较了降水输入加倍情景下的模型性能。该测试评估了模型在极端气候条件下的鲁棒性和响应。

定量指标(完整数据集)：

表 I：完整数据集的定量性能指标。

定量指标(稀疏数据集 - 5%)：

表 II：稀疏数据集(5%数据)的定量性能指标。

对比水文过程线显示，在合成的“极端气候”压力测试(2倍降水)中，物理信息模型产生了方向一致的流量上升。相比之下，基线模型表现出饱和和异常波动，未能外推强降雨与河流流量之间的因果关系。

结果强调了一个关键权衡：虽然像LSTM这样的深度学习模型是强大的特征提取器，但当数据稀缺或分布外时，它们容易过拟合和产生物理不一致性。物理信息方

物理信息机器学习用于短期洪水预测

相似文章

克服地球观测中的“Physics Shock”：一种用于基于PINN的洪水推理的异方差不确定性框架

小数据约束下的物理信息机器学习：来自磨料水射流铣削的经验教训

具有可学习损失平衡和迁移学习的物理信息神经网络

PIMSM: 物理信息驱动的多尺度Mamba：分布偏移下稳定的神经表示

Frequency Shift Physics-Informed Extreme Learning Machine for Solving High-Frequency Partial Differential Equations

提交意见反馈