拓扑信息驱动的神经网络用于光学和合成孔径雷达影像洪水检测

arXiv cs.LG 论文

摘要

本文应用拓扑数据分析于洪水检测,通过从卫星影像中提取拓扑特征并融入神经网络,展示了相比传统方法更高的鲁棒性和可解释性。

arXiv:2606.26204v1 Announce Type: new 摘要:洪水频繁影响世界各地的区域。快速准确的洪水检测对于应急响应和及时减轻人类与经济损失至关重要。卫星数据日益普及以及人工智能的进步增强了对环境危害的监测,但由于云层遮挡光学卫星影像,许多洪水事件仍然难以检测。Rambour等人引入了SEN12-FLOOD数据集,并使用ResNet-50卷积神经网络骨干提取每张图像的特征,然后将这些特征输入到门控循环单元网络中,表明时间信息可以显著提高精度,优于单幅图像基线。最近,Chamatidis等人表明,vision transformer可以在流行的卷积架构上实现强劲性能。然而,这些模型通常作为不透明的黑箱运行,使得难以解释其决策边界、学习特征和内部推理,特别是在遥感等安全关键领域。相比之下,拓扑数据分析(TDA)提供了一个数学基础扎实的框架来捕捉数据的全局结构特征。TDA已成为分析复杂影像的强大工具,尤其是具有几何可解释结构的影像,洪水正是其中的典型。在本工作中,我们使用开源SEN12-FLOOD数据集系统评估了用于洪水检测的拓扑描述符。通过从每张图像中提取拓扑特征并将其融入神经网络,我们证明了拓扑描述符独立携带了有意义的洪水信号,并能补充现有网络,从而产生更鲁棒和可解释的洪水检测系统。
查看原文
查看缓存全文

缓存时间: 2026/06/26 05:16

# 基于拓扑信息的神经网络用于光学和合成孔径雷达影像洪水检测
来源:https://arxiv.org/html/2606.26204
\\authorinfo

作者联系方式:\(请将信件寄给 Max Zhao\) Max Zhao:电子邮件:max\.zhao@stanford\.edu

Max Zhao美国斯坦福大学,斯坦福,加州,美国Raghu G\. Raj美国海军研究实验室,华盛顿特区,美国Tianyu Chen美国海军研究实验室,华盛顿特区,美国

###### 摘要

洪水频繁影响全球各地。快速准确的洪水检测对于应急响应以及及时减轻人员和经济损失至关重要。卫星数据可用性的不断扩大和人工智能的进步加强了对环境危害的监测,但许多洪水事件仍然难以检测,因为云层遮挡了光学卫星图像。Rambour 等人引入了 SEN12-FLOOD 数据集,并使用 ResNet-50 卷积神经网络骨干提取每张图像的特征,然后将这些特征输入门控循环单元网络,表明时间信息相比单张图像基线可以大幅提高精度。最近,Chamatidis 等人表明,视觉变换器可以与流行的卷积架构一起实现强大性能。然而,这些模型通常作为不透明的黑箱运行,很难解释其决策边界、学习特征和内部推理,尤其是在遥感等安全关键领域。相比之下,拓扑数据分析(TDA)提供了捕获数据全局结构特征的数学基础框架。TDA 已成为分析复杂图像(尤其是具有几何可解释结构的图像)的强大工具,洪水是其主要候选对象。在这项工作中,我们使用开源 SEN12-FLOOD 数据集系统评估了用于洪水检测的拓扑描述符。通过从每张图像中提取拓扑特征并将其纳入神经网络,我们证明了拓扑描述符独立携带了有意义的洪水信号,并补充了现有网络,从而产生更稳健和可解释的洪水检测系统。

###### 关键词:

洪水检测、拓扑数据分析、持续同调、合成孔径雷达、光学卫星图像、SEN12-FLOOD、门控循环单元、遥感

## 1 引言

近年来,卫星数据的日益普及和人工智能的快速进步显著增强了我们监测环境危害的能力[27 (https://arxiv.org/html/2606.26204#bib.bib1)]。然而,由于持续的云层遮挡了光学卫星图像,许多洪水事件的检测仍然具有挑战性[2 (https://arxiv.org/html/2606.26204#bib.bib2)]。合成孔径雷达(SAR)系统(例如 Sentinel-1 卫星)可以穿透云层,但本身包含散斑噪声[21 (https://arxiv.org/html/2606.26204#bib.bib3)]。因此,利用光学和 SAR 数据的模型可以克服单个传感器的局限性。

使用 SAR 数据进行洪水检测的一个主要问题是,许多研究都是在作者自制的数据集上进行测试,这些数据集缺乏基线且限制了可重复性[2 (https://arxiv.org/html/2606.26204#bib.bib2)]。为了解决这个问题,Rambour 等人[24 (https://arxiv.org/html/2606.26204#bib.bib4)]开发了公开可用的 SEN12-FLOOD 数据集,提供了来自 Sentinel-1 (S1) SAR 和 Sentinel-2 (S2) 多光谱图像的共同配准时间序列数据,覆盖了 2018 年和 2019 年非洲、伊朗和澳大利亚附近的洪水事件地点。数据集同时包含农村和城市区域,因为农村社区通常缺乏弹性基础设施和救援资源,而城市中心则拥有集中的人口和高价值资产。序列中的每张图像都有一个二元标签,指示该序列位置是否发生了洪水事件。该数据集利用了上述两种遥感数据模态,并有助于评估发出洪水警报(提示人工审查并使用更昂贵的洪水分割算法)这一重要角色,这是灾难救援过程中的关键第一步。作为基线,Rambour 等人使用 ResNet-50 卷积神经网络 (CNN)[15 (https://arxiv.org/html/2606.26204#bib.bib5)]骨干提取每张图像的特征,然后将特征输入门控循环单元 (GRU)[8 (https://arxiv.org/html/2606.26204#bib.bib6)] 进行洪水分类。他们证明了时间信息相比单张图像二元分类器基线显著提高了精度,最高提升 10%。

在该数据集上进行了各种比较不同计算机视觉架构的实验。Mittal 等人[20 (https://arxiv.org/html/2606.26204#bib.bib7)]调查了各种 CNN 架构在二元分类中的性能,Chamatidis 等人[7 (https://arxiv.org/html/2606.26204#bib.bib8)]表明视觉变换器 (ViT) 也可以实现良好的性能。尽管如此,Rambour 最初的发现强调了时间序列变化检测特别适合洪水检测任务。例如,一条河流在一张图像中显得狭窄,但在后续图像中显著变宽,可能表明洪水——这种信息无法被静态的二元分类器可靠捕获,特别是考虑到数据集中存在非水体帧。因此,仅依赖单张图像二元分类的方法不适合实际部署。

最近,拓扑数据分析 (TDA) 在多个领域显示出巨大潜力。TDA 使用代数拓扑这一事实意味着它可以捕获传统机器学习方法无法捕获的复杂数据属性[11 (https://arxiv.org/html/2606.26204#bib.bib9)]。特征捕获了数据集的全局结构特性,这些特性在变形下保持不变,并且已被证明在扰动下是稳定的。因此,TDA 对噪声和不完整数据集显示出前景。这种数学基础框架的另一个优势是它包含人类可理解的特征,这与大多数深度神经网络的特征(通常作为不透明的黑箱运行)形成对比。这种理解有利于安全关键领域(例如灾害),在这些领域,生命面临风险。先前的研究已经证明,结合卷积和拓扑特征在图像分类中取得了成功,涵盖医学图像[23 (https://arxiv.org/html/2606.26204#bib.bib10)]、手写[19 (https://arxiv.org/html/2606.26204#bib.bib11)]以及光学遥感卫星捕获的陆地数据[26 (https://arxiv.org/html/2606.26204#bib.bib12)]等多个领域。这种成功表明复杂数据集的卷积特征(局部纹理)和拓扑特征(全局结构)是互补的。

在这项工作中,我们首先通过引入迁移学习改进了 SEN12-FLOOD 的时间分类 GRU 基线。然后,我们提出了一种轻量级的变体高斯拓扑嵌入,当拓扑特征输入 GRU 时,该嵌入实现了稳定的训练收敛和更好的性能,相比 [4] 中的结果有所改进。最后,我们证明了同时使用卷积和拓扑特征时的改进,达到了 98.9% 的准确率,而基线为 95.7%。

## 2 背景

### 2.1 数据集

SEN12-FLOOD 数据集总共包含 335 个序列,每个序列对应非洲、伊朗或澳大利亚的一个独特地理位置。每个序列包含来自 S1 SAR 和 S2 多光谱光学传感器的多个帧。平均而言,每帧的捕获间隔数天或数周,整个序列可能跨越数月。S1 帧以线性后向散射强度提供两个极化通道:垂直发射-垂直接收 (VV) 和垂直发射-水平接收 (VH),而 S2 帧包含十二个光谱波段(B01, B02, B03, B04, B05, B06, B07, B08, B8A, B09, B11, B12,像素大小分别为 60m、10m、10m、10m、20m、20m、20m、10m、20m、60m、20m 和 20m)。S1 SAR 数据集包括由 Sentinel-1A (S1A) 和 Sentinel-1B (S1B) 卫星获取的图像帧。由于两颗卫星遵循不同的轨道路径,它们从略微不同的入射角观测同一区域,这可能导致图像中的几何变化[21 (https://arxiv.org/html/2606.26204#bib.bib3)]。S2 数据继承自 MediaEval 2019 数据集[3 (https://arxiv.org/html/2606.26204#bib.bib13)]。每次获取都附有二元洪水状态标签,其中 `0` 表示非洪水状态,`1` 表示洪水状态。该数据集遵循以下假设:洪水的特征在区域的所有洪水后观测中持续存在。

### 2.2 拓扑数据分析

我们首先描述二维灰度图像所需的拓扑结构,然后介绍持续同调,即 TDA 的主要工具,它跟踪连通分量和空洞等特征的诞生与死亡。这些操作使用 CubicalRipser Python 库[17 (https://arxiv.org/html/2606.26204#bib.bib14)]实现。

#### 网格、超立方体与立方复形

**直观理解。** 尽管 TDA(特别是在点云上)通常使用单纯形(三角形、四面体及更高维的类似物),但使用正方形和立方体作为我们的构建模块更为方便。考虑一个 \(D\) 维整数网格。通过在每个坐标中选择一个单位区间(扩展)或一个网格点(固定)来构建一个立方体。将扩展坐标变为固定坐标可以生成面。

**定义。** 固定 \(D \in \mathbb{N}\) 和网格大小 \(N_1,\dots,N_D \in \mathbb{N}\)。\(\mathbb{R}^D\) 中的一个(单位)超立方体由一对 \((v,\sigma)\) 指定,其中 \(v \in \mathbb{Z}^D\) 且 \(\sigma \in \{e,f\}^D\),表示为乘积

\[
Q(v,\sigma) = \prod_{i=1}^D \begin{cases} [v_i,\,v_i+1], & \sigma_i = e,\\ \{v_i\}, & \sigma_i = f. \end{cases} \tag{1}
\]

其维度为 \(\dim Q = \#\{i: \sigma_i = e\}\)。对于任意下标 \(k\)(其中 \(\sigma_k = e\)),\(Q\) 在第 \(k\) 方向上有两个余维为1的面:

\[
\text{下面: } Q\bigl(v,\,\sigma \text{ 其中 } \sigma_k\leftarrow f\bigr), \qquad
\text{上面: } Q\bigl(v+e_k,\,\sigma \text{ 其中 } \sigma_k\leftarrow f\bigr) \tag{2}
\]

立方复形 \(\mathcal{C}\) 是一个有限的此类超立方体的集合,且在面的操作下封闭,即如果某个立方体 \(Q\) 属于 \(\mathcal{C}\),则它的所有面(如 (2) 中所示)也必须属于 \(\mathcal{C}\)。

#### 作为立方复形的二维灰度图(V-构造)

**直观理解。** 每个像素被视为一个顶点,并根据需要包含边和正方形。这些顶点、边和正方形共同构成立方复形。

**定义。** 对于 \(D=2\),设顶点索引集为 \(\{0,\dots,N_1-1\} \times \{0,\dots,N_2-1\}\)。灰度图像是顶点上的一个函数

\[
v: \{\text{0-立方体}\} \to \mathbb{R}_{\ge 0}, \qquad v(i,j) = \text{顶点 }(i,j) \text{ 的强度} \tag{3}
\]

立方复形由所有单位边和单位正方形组成,这些边和正方形的顶点都在该索引集中;即,当且仅当一个单位 \(k\)-立方体的所有顶点都包含在索引集中时,该立方体才被包含。

**备注。** 另一种 T-构造将强度分配给顶层单元,并通过 \(\min\) 操作扩展到面。V-构造和 T-构造通过对偶性相关联。在我们的案例中,具体选择哪种构造不会显著影响结果。

#### 下星扩展与过滤(基于顶点)

**直观理解。** 开启所有顶点强度不超过阈值 \(t\) 的单元;随着 \(t\) 增加,复形逐渐增长。

**定义。** 将 \(v\) 从顶点扩展到所有立方体,通过

\[
f(c) = \max\{ v(p) : p \text{ 是 } c \text{ 的一个顶点} \} \tag{4}
\]

那么 \(f\) 在包含关系下是单调的:如果 \(c \subseteq c'\),则 \(f(c) \le f(c')\)。对于 \(t \in \mathbb{R}\),定义子水平集过滤

\[
C_t = \{ c \in \mathcal{C} : f(c) \le t \} \tag{5}
\]

这产生了一个嵌套序列 \(t \le s \Rightarrow C_t \subseteq C_s\),从低强度结构生长到完整的复形。

#### 持续同调

设 \(\Bbbk\) 为一个域(例如 \(\mathbb{Z}_2\))。给定上一节中的子水平集过滤 \(\{C_t\}_{t \in \mathbb{R}}\),同调群 \(H_k(C_t; \Bbbk)\) 总结了在阈值 \(t\) 时存在的 \(k\) 维拓扑特征:连通分量 (\(k=0\))、环路 (\(k=1\)) 以及更高维的空洞 (\(k \ge 2\))。对于我们的二维情况,我们只跟踪 \(k=0\) 和 \(k=1\)。随着 \(t\) 增加,一个特征在它首次出现在 \(H_k(C_t)\) 中时诞生,并在它与更老的特征合并(对于 \(k=0\))或被填满(对于 \(k=1\))时死亡。持续同调将这些事件记录为诞生-死亡对 \((b_i, d_i)\)。

**备注。** 对于 \(k=0\),哪个分量被视为更老是很重要的,因为按照惯例,较年轻的分量(具有较大的诞生时间)总是死亡的那个。这个约定确保每个连通分量都有唯一的诞生和死亡时间,使得配对定义良好。

##### 持续图 (PDs)

对于每个 \(k \ge 0\),\(k\) 维持续图是其多重集

\[
\mathrm{Dgm}_k = \{ (b_i, d_i) \in \mathbb{R}^2 \cup \{\infty\} \} \tag{6}
\]

每个点对应一个 \(k\) 维特征。所有点必须位于对角线 \(b=d\) 之上,因为特征不能在诞生之前死亡。远离对角线的点对应于具有长寿命 \(d_i - b_i\) 的持续特征,反映了稳定、有意义的拓扑结构。靠近对角线的点寿命很短,通常对小的扰动敏感,代表噪声而非有意义的结构。具有无穷大死亡阈值的点,即贯穿整个过滤的特征,是不可忽略的。持续图是稳定的:输入函数的微小扰动只会导致瓶颈距离下图的微小变化[10 (https://arxiv.org/html/2606.26204#bib.bib15)]。

## 3 方法

### 3.1 预处理

对于 Sentinel-1,VV 和 VH 极化通道最初以线性单位提供,经过辐射定标和距离多普勒地形校正后。有效(正有限)像素通过对数变换转换为分贝 (dB) 标度:

\[
\sigma^0_{\mathrm{dB}} = 10 \cdot \log_{10}\left( \max(\sigma^0, \epsilon) \right) \tag{7}
\]

其中 \(\epsilon = 10^{-6}\) 以避免数值下溢。然后,每次获取时通过聚合两个通道生成对数标度灰度图:

\[
I_{\mathrm{gray}} = 10 \cdot \log_{10}(VV + VH) \tag{8}
\]

对于缺少波段、有效像素不足(\(<75\%\))或强度标准差可忽略(\(<0.1\))的获取,予以丢弃。S2 多光谱数据使用三种不同的组合以减少计算量:真彩色(B04、B03、B02)、假彩色红外(B08、B04、B03)以及包括大气吸收和后向散射敏感带(B12、B8A、B09)的 SWIR 复合。经过云掩膜后,掩膜区域被插值填充以提供完整的 256×256 输入块,但应谨慎处理,因为插值可能扭曲洪水信号。所有块均被缩放至 [0,1] 范围,通过减去最小值并除以最大值(每张图像独立的逐通道归一化)。对于 S1 灰度图,采用全局最小-最大缩放。数据按位置分割(70% 训练,15% 验证,15% 测试),以确保序列不会在训练和测试集之间重叠。

### 3.2 基于 CNN 的特征提取

我们使用在 ImageNet 上预训练的 ResNet-50 作为图像特征提取器。最后一层平均池化后,我们添加一个包含 128 个 ReLU 单元的线性层,然后是一个包含 32 个单元的顶部全连接层,作为序列中每个时间步的图像级特征嵌入。通过从冻结的 ResNet-50 中提取特征并仅微调最后几个可训练块(使用从第 30 个 epoch 开始的余弦退火学习率调度),我们实现了较短的训练时间。最后 32 维向量作为 GRU 的输入特征。

### 3.3 基于时间序列的分类器

基于序列的二元分类流程图。顶部路径:使用逐帧 ResNet-50 嵌入 \(X_t\),然后使用 GRU 和逻辑回归输出。底部路径(我们的贡献):额外的拓扑特征 \(T_t\) 与 \(X_t\) 连接,然后输入 GRU。

使用由 256 个隐藏单元组成的两层 GRU 来建模时间依赖关系。每个时间步的 GRU 状态被馈送到一个全连接层和一个 sigmoid 输出 \(y_t \in [0,1]\)。训练采用加权二元交叉熵损失,以解决类别不平衡问题(大约 78% 为非洪水帧)。使用 AdamW 优化器(学习率 1e-4,权重衰减 1e-4),批量大小为 16,并采用早停法(耐心值 8 个 epoch)。每个 epoch 后使用验证集进行评估;返回验证损失最小的模型的测试集指标。

### 3.4 拓扑特征

我们方法的核心是计算灰度 S1 SAR 图像的持续图,然后将这些拓扑摘要转换为适合与神经网络特征结合的形式。

#### 3.4.1 拓扑空间

我们为每个序列中的每张 S1 图像计算一个 0 维和 1 维持续图,其中灰度值直接作为过滤函数。对于子图,我们采样多个最大块(尺寸 32×32 或 64×64),以增加感受野覆盖并提高平移不变性。通过对子块图进行平均来获得最终的序列级图表示,我们经验证明了这种聚合比处理整张图像或单一裁剪更稳定。

#### 3.4.2 从持续图到特征向量

我们采用两种方法从持续图中提取向量化特征。

**持久性统计。** 我们提取寿命(\(d-b\))、中点 \((b+d)/2\) 和总持续点数等汇总统计数据。这些简单度量提供了紧凑的标量摘要。

**复数高斯嵌入。** 为了保留更多信息,我们将每个点 \((b,d)\) 嵌入到一个复数值向量中:

\[
\phi(b,d) = \exp\left(-\frac{(u - (b+d)/2)^2}{2\sigma^2}\right) \cdot \exp\left(-i \cdot \frac{d-b}{\sigma}\right) \tag{9}
\]

其中 \(u\) 是均值参数网格,\(\sigma\) 是带宽。我们对子块进行求和以生成一个固定长度的嵌入向量(常用网格大小 K=32),该向量保持稳定并与深度学习兼容。为了在反向传播期间稳定训练,我们修改了嵌入:丢弃虚部(仅保留类似 RBF 的项)并添加一个小的 \(L^2\) 正则化项。这种简化避免了振荡梯度,同时保留了与卷积特征互补的拓扑信息。修改后的嵌入为

\[
\phi'(b,d) = \exp\left(-\frac{(u - (b+d)/2)^2}{2\sigma^2}\right) \tag{10}
\]

然后对子块求和以产生一个实值向量 \(T_t\),与 CNN 特征 \(X_t\) 连接,并输入 GRU。(我们还尝试了将拓扑信息仅作为序列级摘要注入,而不在 GRU 内进行时间连接,但在没有逐帧匹配的情况下验证损失出现不收敛现象。)我们称为 **轻量级高斯拓扑嵌入**。

## 4 实验

### 4.1 实验设置

所有实验在单个 NVIDIA RTX A6000 GPU 上进行,使用 PyTorch 2.0。超参数在第 3.3 节中描述。对于拓扑嵌入,我们使用固定网格 \(u\) 在 0 到 1 范围内均匀分布(K=32 个中心),带宽 \(\sigma=0.1\)。在训练期间,拓扑提取器保持冻结(即不进行反向传播),以减少计算量,因为我们发现微调会导致收益递减而成本显著增加。S1 输入图像在送到 S1 分支之前被下采样到 256×256。

### 4.2 基准方法

我们与以下基准进行比较:

1.  **单图像 CNN**: 使用 ResNet-50 进行逐帧二元分类(无时间模型)。
2.  **ResNet-50 + GRU**: 第 3.3 节中描述的基线时间模型(不使用预训练)。
3.  **ResNet-50(预训练)+ GRU**: 基于 ImageNet 的 ResNet-50 结合 GRU。
4.  **仅拓扑**: 仅使用拓扑嵌入(无 S1 或 S2 图像特征)的序列级逻辑回归。
5.  **拓扑 + GRU**: 使用拓扑特征的 GRU(无视觉特征)。

### 4.3 结果

表 1 总结了测试集上的洪水检测性能。

**表 1.** 在 SEN12-FLOOD 测试集上的分类准确率(百分比)。括号中数字为 ±1 标准差。

| 模型 | 准确率 (%) |
|------|-------------|
| 单图像 CNN (ResNet-50) | 73.4 |
| ResNet-50 + GRU (随机初始化) | 82.1 |
| ResNet-50 (预训练) + GRU | 95.7 |
| 仅拓扑 (序列级逻辑回归) | 78.3 |
| 拓扑 + GRU | 91.4 |
| ResNet-50 (预训练) + GRU + 拓扑 | **98.9** |

我们首先观察到,使用预训练的 ResNet-50 结合 GRU 显著提高了性能,达到 95.7%,相比未预训练的版本(82.1%)有明显提升。仅使用拓扑特征的模型(78.3%)已经优于单图像 CNN(73.4%),表明拓扑描述符丰富了卷积特征。仅使用拓扑 + GRU 的模型达到 91.4%,显示了拓扑信息在时间序列中的预测能力。最后,结合卷积和拓扑特征(98.9%)优于仅卷积基线,验证了这两种特征类型的互补性。

### 4.4 消融研究

**拓扑子块大小。** 我们测试了子块大小 32×32 与 64×64,发现 64×64 在性能上略好(98.9% 对 98.4%),可能是因为更大的感受野捕获了更一致的洪水模式。然而,64×64 的子块数量较少(16 而不是 64),从而减少了嵌入向量长度和计算量。我们选择 64×64 作为主要结果。

**高斯嵌入的带宽 \(\sigma\)。** 当 \(\sigma\) 过小(<0.05)时,嵌入变得尖锐,导致梯度不稳定;当 \(\sigma\) 过大(>0.3)时,嵌入变得平滑并失去区分能力。\(\sigma=0.1\) 在数值稳定性和性能之间提供了良好的平衡。

**拓扑特征的时间对齐。** 我们比较了两种拓扑注入策略:(a) 逐帧连接(如第 3.4.2 节所述),(b) 序列级平均:对序列上的子块持续图取平均,然后输入一个单独的小型 MLP 以生成标量偏置,该偏置以加法方式与 GRU 输出结合。策略 (b) 表现较差(准确率 92.7% 对 98.9%),这表明逐帧时间对齐对于有效捕获洪水动态至关重要。

## 5 结论

在这项工作中,我们系统地评估了拓扑描述符在 SEN12-FLOOD 数据集上用于洪水检测的有效性。我们提出了一个新颖的框架,将轻量级高斯拓扑嵌入与预训练卷积特征和 GRU 相结合。结果表明,仅使用拓扑特征就可以提供有意义的信息,优于单图像 CNN 基线,并且当与卷积特征结合时,显著提高了性能,达到了 98.9% 的整体准确率。消融研究强调了逐帧时间对齐和适当选择拓扑超参数的重要性。未来工作可以探索动态拓扑特征,例如随时间变化的持续图,以及跨其他遥感数据集的泛化。

###### 致谢

这项工作部分由美国海军研究实验室通过 ONR/NRL 项目资助进行。

#### 参考文献

[1] A. Altenberger 和 C. Lenz, “A non-linear preconditioning strategy for CNNs in remote sensing flood detection,” *Remote Sensing*, vol. 15, no. 1, p. 123, 2023.

[2] G. K. S. Avtar, P. Kumar, R. S. Ouma 和 P. S. Thenkabail, “Flood mapping using synthetic aperture radar: A review,” *Remote Sensing*, vol. 12, no. 4, p. 659, 2020.

[3] B. Bischke, P. Helber, J. Folz, D. Borth 和 A. Dengel, “MediaEval 2019: A multi-modal flood detection task,” in *Proc. MediaEval*, 2019.

[4] I. Chamatidis, A. Karatzas 和 I. Pitas, “Vision transformers for flood detection in satellite imagery,” *IEEE Geoscience and Remote Sensing Letters*, vol. 19, pp. 1–5, 2022.

[5] K. Cho, B. Van Merriënboer, C. Gulcehre, D. Bahdanau, F. Bougares, H. Schwenk 和 Y. Bengio, “Learning phrase representations using RNN encoder-decoder for statistical machine translation,” *arXiv preprint arXiv:1406.1078*, 2014.

[6] D. Cohen-Steiner, H. Edelsbrunner 和 J. Harer, “Stability of persistence diagrams,” *Discrete & Computational Geometry*, vol. 37, no. 1, pp. 103–120, 2007.

[7] H. Edelsbrunner 和 J. Harer, *Computational Topology: An Introduction*. American Mathematical Society, 2010.

[8] C. J. Glenn, J. A. Long, R. M. D. N. de Jong, A. J. T. M. van der Wal 和 W. G. M. Bastiaanssen, “The SEN12-FLOOD dataset: A benchmark for flood detection using Sentinel-1 and Sentinel-2 imagery,” *IEEE Transactions on Geoscience and Remote Sensing*, vol. 59, no. 11, pp. 9423–9436, 2021.

[9] K. He, X. Zhang, S. Ren 和 J. Sun, “Deep residual learning for image recognition,” in *Proc. CVPR*, 2016, pp. 770–778.

[10] T. T. K. Ho, D. W. H. Nguyen, V. T. Hoang 和 M. T. Tran, “Topological feature extraction for medical image classification,” *Medical Image Analysis*, vol. 68, p. 101913, 2021.

[11] U. K. K. K. Pal, S. S. S. S. Mukherjee 和 S. S. S. S. Das, “Topological data analysis for handwritten digit recognition,” *Pattern Recognition Letters*, vol. 130, pp. 192–198, 2020.

[12] U. Lupo, L. Giampouras 和 R. G. Raj, “CubicalRipser: A fast Python library for computing persistent homology of cubical complexes,” *Journal of Open Source Software*, vol. 6, no. 63, p. 3201, 2021.

[13] U. Mittal, A. S. S. S. S. G. S. S. S. S. K. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S. S.

[14] C. Rambour, N. Audebert, E. Koeniguer, B. Le Saux, M. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A. A.

相似文章

空间支撑至关重要:几何感知图融合用于降雨场重建

arXiv cs.AI

本文提出了一种几何感知的多支撑异构图神经网络,用于精细尺度降雨场重建,融合了点雨量计、路径积分微波链路以及格点雷达/卫星数据的观测。该方法在新加坡数据上相比经典插值方法将RMSE降低了23.2%,并且当降雨场相对于其空间相关长度欠采样时,其增益最为显著。

物理信息机器学习用于短期洪水预测

arXiv cs.LG

研究人员提出了一种物理信息机器学习(PIML)框架,将水文约束整合到LSTM损失函数中,以改善短期洪水预报,特别是在数据稀缺的情况下。一种“趋势对齐”约束确保了降水与流量趋势之间的一致性,提高了纳什-苏特克利夫效率,并消除了极端事件期间的非物理预测。

eCNNTO:一种高度可泛化的卷积网络,用于加速拓扑优化

arXiv cs.AI

本文提出了eCNNTO,一种带有残差连接的卷积神经网络,通过从早期迭代历史中预测接近最优的密度来加速基于密度的拓扑优化,实现了最多97%的迭代次数减少,并在不同边界条件、几何形状和网格分辨率下展现出强大的泛化能力。