基于GPU加速的深度学习用于热浪预测和城市热风险评估
摘要
本文提出了一种使用ConvLSTM模型的GPU加速深度学习框架,用于预测次日城市热状况并生成热风险地图,在萨拉热窝数据上取得了优异性能(R²=0.8877)。
arXiv:2605.16435v1 公告类型:新
摘要:热浪是城市中的一个重要问题,气候变化使这个问题更加严峻。在本文中,我们提出了一种基于GPU的深度学习框架,用于次日城市热状况预测和热风险评估。研究在萨拉热窝进行,使用了MODIS地表温度数据和Open-Meteo预报数据。我们测试了多种模型,包括卷积模型和时空模型。其中,使用混合损失函数的ConvLSTM取得了最佳结果。获得的指标为MAE = 0.2293,RMSE = 0.3089,R² = 0.8877。实验还表明,使用更长时间序列和额外的气象变量可以改善结果。由于该框架在GPU上实现并采用混合精度训练,执行时间得以缩短。基于预测的温度场,还可以将灾害信息与暴露度和脆弱性数据结合,以生成城市热风险地图。所提出的框架可作为城市热分析的实用基础。
查看缓存全文
缓存时间: 2026/05/19 06:43
# GPU加速的深度学习用于热浪预测与城市热风险评估 来源:https://arxiv.org/html/2605.16435 \[1\]\\fnmAdis\\surAlihodzic(ORCID:0000-0003-0761-1667) \[1\]\\orgdiv数学与计算机科学系,\\orgname萨拉热窝大学理学院,\\orgaddress\\city萨拉热窝,\\country波斯尼亚和黑塞哥维那 ###### 摘要 热浪是城市中的一个重要问题,而气候变化使这一问题更加严峻。本文提出了一种基于GPU的深度学习框架,用于次日城市热状况预测和热风险评估。研究以萨拉热窝为案例,使用了MODIS地表温度数据和Open-Meteo预报数据。我们测试了多种模型,包括卷积模型和时空模型。其中,采用混合损失函数的ConvLSTM取得了最佳效果,其MAE = 0.2293,RMSE = 0.3089,R² = 0.8877。实验还表明,通过使用更长时间序列和额外气象变量可以进一步改善结果。由于该框架在GPU上实现并采用混合精度训练,执行时间得以减少。基于预测的温度场,还可以将灾害信息与暴露度和脆弱性数据相结合,生成城市热风险地图。所提出的框架可作为城市热分析的实用基础。 ###### 关键词: 热浪预测,城市热风险,深度学习,GPU加速,时空模型,ConvLSTM,气候数据分析 ## 1 引言 热浪是当今影响最严重的气候极端事件。众所周知,在许多地区,热浪变得更加频繁、更加强烈、持续时间更长。其影响体现在公共卫生、能源需求、劳动生产率和城市基础设施等方面。近期研究表明,热相关死亡率与极端高温期密切相关,尤其是在城市地区,城市环境可能进一步加剧热应力[CHEVAL2024100603, CUERDOVILCHES2023164412, Huang2023]。此外,城市地区对极端高温尤为敏感,因为密集的建筑、不透水材料、植被减少以及有限的空气流通往往使城市比周边乡村地区更热——这一现象被称为城市热岛效应。在热浪期间,气候变化与城市热岛效应的共同作用可能进一步恶化热环境。因此,预测城市热状况并评估城市热风险已成为环境建模、公共卫生和城市规划中的关键课题[CHEVAL2024100603, CUERDOVILCHES2023164412, Hsu2021]。另一个关键点是,城市热量并非均匀影响城市的所有要素。城市的一些区域植被更多、通风更好,而另一些区域则是高密度建成区和大面积不透水表面。人口暴露度在不同地点也并非均匀分布。近期研究表明,城市热暴露可能在空间上不均等,且与人口和社会经济模式密切相关。因此,城市热分析不应仅基于温度预测,还应纳入暴露度和脆弱性因素[Hsu2021, Huang2023, Pan2024, DAmbrosio2023]。卫星产品提供了空间详细的地表温度信息,而网格化人口数据集可用于估算人口暴露度[YE2025100870, Tatem2017]。MODIS地表温度产品广泛应用于热红外遥感,并已在文献中得到广泛验证[WAN200859, DUAN201916]。来自WorldPop项目的人口数据也常用于空间暴露度分析[Tatem2017, Lloyd2017]。传统的热浪分析通常依赖于统计方法、物理建模和传统机器学习方法[Geophysics2023, su17083747]。尽管这些方法适用,但当过程同时表现出强烈的空间和时间依赖性时,它们可能受到限制。因此,近年来深度学习方法因其在时空预测问题中表现良好而受到越来越多的关注[BOUDREAULT2025109965, atmos16010082]。卷积神经网络适合学习空间模式[10.1007/978-981-19-1122-4-47],而ConvLSTM架构则旨在同时建模空间和时序结构。除预测精度外,计算效率在实践中也很重要。高分辨率城市热建模涉及大量时空数据集和重复模型训练,可能需要大量的计算时间[ijgi4042306, hydrology11080127]。因此,GPU加速在实践中的重要作用日益凸显,能够加快现代深度学习工作流程中的训练和推理速度[Pandey2022, s24020514]。当预测结果需要转化为城市热风险图层以用于实际决策支持时,这一点尤为有用[LiWang2021, Pan2024]。在本章中,我们从实践角度考虑热浪预测和城市热风险评估。主要思路是将卫星获取的地表温度与每日气象强迫数据结合,构建一个GPU加速的深度学习框架。我们考虑两类模型:CNN基线模型和ConvLSTM模型。此外,通过将预测的热强度与暴露度和脆弱性信息相结合,构建了一个简化的城市热风险图层。通过这种方式,本章将温度预测与基于风险的解释联系起来,可用于气候适应和城市规划研究[Pan2024, DAmbrosio2023]。本章的主要贡献如下:首先,提出了一种将卫星热数据与每日气象强迫相结合的实际框架,用于短期城市热预测。其次,讨论了GPU加速在深度学习模型训练和评估中的作用。第三,实验分析了数据集设计、时间覆盖范围和多位置气象强迫对预测性能的影响。第四,概述了一种根据预测热条件、暴露因子和脆弱性因子生成城市热风险地图的简化方法。本章其余部分组织如下:第2节介绍热浪预测、城市热分析和深度学习方法的相关工作。第3节描述研究区域、数据来源和预处理步骤。第4节介绍所提出的GPU加速框架及考虑的预测模型。第5节解释城市热风险层的构建。第6节介绍实验结果和性能分析。最后,第7节给出结论及未来工作的可能方向。 ## 2 相关工作 ### 2.1 深度学习用于热浪与城市热预测 近期研究表明,深度学习在热相关预测任务中越来越受关注。在极端高温预报的广泛领域中,深度学习模型已被应用于从气象变量预测极端热事件,报告的结果表明这种数据驱动方法能够取得良好的预测性能[Shafiq2025]。深度学习也已用于城市热研究,特别是地表温度预测和城市热岛分析,包括基于多传感器数据和机器学习方法的预测与评估框架[10938603, Wang2025]。然而,目前仍相对缺乏将卫星热场与每日气象强迫结合在实用框架中用于次日城市热预测的研究。 ### 2.2 城市热风险评估与脆弱性制图 另一个重要方向是将热信息转化为以风险为导向的空间分析。近期研究表明,城市热评估不应局限于温度制图,还应纳入暴露度、脆弱性和人口相关因素[rs16163032]。在此意义上,基于GIS和遥感的框架常被用来结合热指标与环境及人口图层,生成城市热脆弱性或风险地图[Pan2024, DAmbrosio2023]。然而,这些研究大多属于描述性或回顾性分析,而将短期热预测与简化城市热风险制图直接联系起来的实用策略仍然较少。 ### 2.3 环境深度学习中的GPU加速 第三个重要方向是计算效率。环境应用中的深度学习工作流通常包含大型时空数据集、重复的模型训练以及计算密集的制图过程,因此加速在实际中非常重要[Pandey2022]。在城市热应用中,基于GPU的计算已被用于加速热暴露制图,一些研究报告特定空间估算的计算时间减少了99%以上[LiWang2021]。更广泛地说,快速推理对于近实时预测和重复评估也至关重要[Kalfarisi2022]。然而,GPU加速往往仅作为背景实现细节被对待,而较少作为城市热预测与风险导向制图的集成框架中的显式组成部分。总体而言,文献表明基于深度学习的热预测[Ge2025, Lyu2022]、城市热风险评估[atmos14020343]以及GPU加速计算[Kalfarisi2022]大多被分开研究。 ## 3 研究区域、数据来源与预处理 ### 3.1 研究区域:萨拉热窝 参考图注 (a) 研究区域:萨拉热窝州。 (b) 基于地形的萨拉热窝空间背景。 图1:研究区域的空间背景。面板(a)显示本章使用的萨拉热窝地理范围,面板(b)展示了周围的地形结构,这些结构导致了城市热行为的空间变异性。 城市热分析的案例研究涵盖了萨拉热窝及其周边社区,之所以选择这些区域,是因为其热行为受到密集城市结构、谷地地形、异质土地覆盖以及持续城市发展的影响。在图1 (https://arxiv.org/html/2605.16435#S3.F1) (a)中,研究区域结合了城市区域、具有不同建筑密度的住宅区、中央交通走廊以及环绕的城郊空间。萨拉热窝及其周边城市区域适合研究热相关现象,因为夏季高温可能因有限的空气循环和局地大气条件而加剧。这一点在图1 (https://arxiv.org/html/2605.16435#S3.F1) (b)所示的地形背景中得到了印证,该城市位于山谷系统中,并受到周围高地地形的影响。这种空间配置使萨拉热窝成为研究更广泛气象强迫与局地城市热响应之间关系的有用范例。 ### 3.2 卫星热数据:MODIS LST 参考图注 (a) 2022年7月14日萨拉热窝的MODIS LST场。 (b) 2017年7月31日萨拉热窝的MODIS LST场。 图2:萨拉热窝夏季MODIS地表温度场示例。面板显示了在32×32网格上的代表性每日热图,突出显示了不同日期城市地表温度模式的空间变异性。 本文主要考虑的热目标是来自MODIS传感器的地表温度。MODIS LST产品在城市气候和环境研究中被广泛使用,因为它们提供了空间明确的热观测数据,且具有规则的时间覆盖。在本研究中,MODIS热图用于表示萨拉热窝逐日的城市热状况。从准备的数据集中提取的一些代表性夏季热场示例如图2 (https://arxiv.org/html/2605.16435#S3.F2)所示,其中不同日期的研究区域空间温度变异性清晰可见。每幅有效的MODIS场景都被转换为萨拉热窝上方的空间温度场,并以适合预测建模的标准化形式存储。在裁剪到研究区域并根据需要移除无效观测后,所有目标场都被安排在共同的32×32网格上。这样,获得了紧凑但仍有空间信息的热表示,适用于深度学习,并能保留对次日城市热预测重要的主要空间差异。 ### 3.3 气象强迫数据:Open-Meteo 参考图注 图3:用于从Open-Meteo服务获取每日气象强迫变量的萨拉热窝位置的代表性空间分布。使用多个位置比依赖单点记录更能代表整个研究区域的大气条件特征。 除了热图像外,所提出的预测框架还使用了来自Open-Meteo服务的每日气象强迫变量。包含这些变量是因为城市热行为不仅取决于地表条件,还取决于周围的大气条件。为了更准确地描述城市上空的每日强迫情况,气象数据是从萨拉热窝的多个地点收集的,而非使用单一点。其空间分布如图3 (https://arxiv.org/html/2605.16435#S3.F3)所示。最终的每日变量集包含温度相关指标、湿度、降水、辐射、云量和风特征。因此,预测框架将来自卫星测量的空间热信息与时间对齐的每日气象强迫相结合。使用多个采样点至关重要,因为萨拉热窝具有空间上不同的城市和地形特征,单一气象记录无法充分捕捉整个研究区域中驱动条件的变异性。 ### 3.4 数据预处理与数据集构建 输入数据 → 预处理 → 模型就绪输出 MODIS LST场景 Open-Meteo每日变量 研究区域定义 空间裁剪至萨拉热窝 无效像素过滤 热数据与气象数据时间对齐 归一化/缩放 为时间模型构建序列 CNN输入 ConvLSTM输入序列 次日32×32热目标 图4:从原始输入到模型就绪输出的预处理流程。 需要预处理阶段,以便将异构原始数据转换为适合深度学习的统一数据集。由于所考虑的数据源在空间分辨率、时间频率和格式上各不相同,所有输入必须在共同的空间和时间框架内组织。整体工作流程总结在图4 (https://arxiv.org/html/2605.16435#S3.F4)中,该图显示了从原始数据采集到构建准备用于模型训练的样本的主要步骤。对于热数据部分,根据需要移除无效的MODIS观测值,并将剩余场景转换为萨拉热窝上空的标准化每日光栅场。对于气象数据部分,每日强迫变量与可用热观测的日期同步。这种时间对齐至关重要,
相似文章
@_akhaliq: GPU Forecasters 语言模型作为内核运行时优化的选择性代理
本文提出使用语言模型作为选择性代理来优化GPU内核运行时,展示了一种新颖的性能预测方法。
基于经验神经正切核的极端天气预报可扩展不确定性量化
本文提出基于神经正切核的不确定性量化方法,用于确定性深度学习天气模型,在极端事件期间无需重新训练即可获得更尖锐的自适应预测区间。
WeatherNext 2: 我们最先进的天气预报模型
Google DeepMind 发布 WeatherNext 2,这是一款先进的 AI 模型,使用单个 TPU 即可在不到一分钟内生成更快、更高分辨率的全球天气预报以及数百种情景。
用于多相输运和热系统数据驱动建模的开放多模态数据集与开源软件
本文介绍了用于可复现的AI驱动热流体研究的开放多模态数据集和开源软件包,提出了时空维度框架及SeqReg等序列回归工具。
AeroJEPA:学习用于可扩展3D气动场建模的语义潜在表示
本文介绍了AeroJEPA,一种用于可扩展3D气动场建模的联合嵌入预测架构。它通过预测流场的语义潜在表示,解决了当前代理模型在可扩展性和设计实用性方面的局限性,从而实现了高效的高保真分析和设计优化。