CHAM-net:一种对比分层自适应元网络,用于稳健的全球甲烷通量预测

arXiv cs.LG 论文

摘要

CHAM-net提出了一种对比分层自适应元网络,能够捕捉站点特定和跨年动态,用于稳健的全球甲烷通量预测,在模拟和观测数据集上均优于基线方法。

arXiv:2606.00338v1 公告类型:新 摘要:甲烷是一种强效温室气体,对全球变暖有显著贡献。然而,由于环境驱动因素在空间和时间尺度上可能存在复杂相互作用,准确估算全球甲烷排放和消耗仍然具有挑战性。此前基于数据驱动的方法常常忽略生态系统固有的时空异质性,未能明确捕捉站点特定特征和跨年演化动态。为解决这些问题,我们提出了一种对比分层自适应元网络(CHAM-net),这是一种新颖的框架,能够从历史背景中明确学习以捕捉站点特定动态。CHAM-net采用分层编码器-解码器架构,其中编码器从历史数据中捕获站点特定特征,然后动态地调节解码器以生成最终预测。实验结果表明,在甲烷排放和消耗的模拟和观测数据集上,CHAM-net始终优于所有基线方法,排放预测的nRMSE值低至0.43和0.88,相应的R2分数分别高达0.97和0.68。
查看原文
查看缓存全文

缓存时间: 2026/06/02 15:41

# CHAM-net:一种用于鲁棒全球甲烷通量预测的对比分层自适应元网络
来源:https://arxiv.org/html/2606.00338
Yiming Sun1, Shuo Chen2, Youmi Oh3,4, Licheng Liu5, Yiqun Xie6 & Xiaowei Jia1  
1匹兹堡大学 2普渡大学 3科罗拉多大学博尔德分校 4NOAA全球监测实验室 5威斯康星大学麦迪逊分校 6马里兰大学  
\{rongchaodong, yis108, xiaowei\}@pitt\.edu, chen4371@purdue\.edu, youmi\.oh@noaa\.gov, licheng\.liu@wisc\.edu, xie@umd\.edu

###### 摘要

甲烷是一种强效温室气体,对全球变暖有显著贡献。然而,由于环境驱动因素之间存在复杂的相互作用并随时空尺度变化,准确估算全球甲烷排放与消耗仍具挑战。已有数据驱动方法常忽视生态系统固有的时空异质性,未能明确捕捉站点特异性特征及跨年演化动态。为解决这些问题,我们提出**对比分层自适应元网络**(CHAM-net),这是一个新颖的框架,通过明确从历史背景中学习来捕捉站点特异性动态。CHAM-net采用分层编码器-解码器架构,其中编码器从历史数据中提取站点特异性特征,然后动态地调节解码器生成最终预测。实验结果表明,在甲烷排放与消耗的模拟和观测数据集上,CHAM-net持续优于所有基线方法,在排放预测中取得了低至0.43和0.88的归一化均方根误差(nRMSE),对应的R²分数分别高达0.97和0.68。

## 1 引言

甲烷(CH₄)是仅次于二氧化碳(CO₂)的第二大温室气体,对自工业革命以来全球温度上升的贡献约占30% (Stocker, 2014 (https://arxiv.org/html/2606.00338#bib.bib21))。与二氧化碳不同,甲烷在大气中具有化学活性,因此大气寿命相对较短,约为9年 (Saunois et al., 2025 (https://arxiv.org/html/2606.00338#bib.bib43))。这一短寿命意味着减少甲烷排放能够带来快速的气候效益,包括减缓升温速率、减少极端气候事件、改善空气质量 (Mar et al., 2022 (https://arxiv.org/html/2606.00338#bib.bib44)),因此甲烷减缓成为保护人类健康、生态系统和脆弱社区最有效的近期策略之一 (Ocko et al., 2021 (https://arxiv.org/html/2606.00338#bib.bib45))。

传统方法主要依赖基于过程的生物地球化学模型 (Zhuang et al., 2004 (https://arxiv.org/html/2606.00338#bib.bib24); Tian et al., 2015 (https://arxiv.org/html/2606.00338#bib.bib22); Zhang et al., 2017 (https://arxiv.org/html/2606.00338#bib.bib23)) 来模拟和估算自然甲烷循环。通过将甲烷生态系统动力学的理论理解与关键环境驱动因素(如土壤特征和温度)相结合,这些模型可以扩展到全球甲烷预测和后续预算估算。然而,它们往往受限于僵化且大量的参数化,导致预测偏差,并在大区域和长时间尺度应用时需要大量计算资源。近年来,数据驱动的机器学习方法 (Kim et al., 2020 (https://arxiv.org/html/2606.00338#bib.bib27); Irvin et al., 2021 (https://arxiv.org/html/2606.00338#bib.bib26); Luo et al., 2023 (https://arxiv.org/html/2606.00338#bib.bib28); Saha et al., 2025 (https://arxiv.org/html/2606.00338#bib.bib29)) 已成为有前景的替代方案,在捕捉环境驱动因素与甲烷通量之间的非线性关系方面展现出强大能力。已有研究进一步探索了从模拟数据向稀疏真实观测(例如从涡度相关塔收集的数据)的知识迁移(如预训练和微调),以提高预测精度 (Sun et al., 2025 (https://arxiv.org/html/2606.00338#bib.bib20))。

然而,现有机器学习方法通常假设空间上不同的甲烷站点由一组共享的全局参数控制,忽略了时空异质性。具体而言,甲烷排放和消耗模式高度依赖于站点,因为不同站点可能因微生物群落和土壤性质的潜在差异而对相似输入驱动因素产生不同响应。例如,图1 (https://arxiv.org/html/2606.00338#S1.F1)(a) 比较了2013年三个站点(US\.Myb (Matthes et al., 2018 (https://arxiv.org/html/2606.00338#bib.bib35))、DE\.Hte (Koebsch and Jurasinski, 2018 (https://arxiv.org/html/2606.00338#bib.bib36)) 和 US\.ORv (Bohrer and Morin, 2015 (https://arxiv.org/html/2606.00338#bib.bib37)))的年排放量。这些站点呈现出明显不同的排放模式和量级。由于未能充分利用站点特异性上下文,现有模型倾向于预测平均值,这可能导致高值区域被低估、低值区域被高估(例如图1 (https://arxiv.org/html/2606.00338#S1.F1)(a) 中站点 DE\.Hte 与 US\.ORv 之间的显著差异)。

见图注 图1:数据集中的时空异质性。

此外,当前机器学习方法大多使用短期数据(例如当前年份的数据),并专注于捕捉短期时间动态(例如降水的季节变化)。然而,它们并非为捕捉许多长期过程(如植被覆盖缓慢变化、土壤成分变化)的影响而设计,这些过程同样会逐年影响甲烷动态。如图1 (https://arxiv.org/html/2606.00338#S1.F1)(b) 所示,对于站点 FI\.Lom (Lohila et al., 2010 (https://arxiv.org/html/2606.00338#bib.bib38)),可以观察到2006年至2009年甲烷总排放量持续下降,反映了站点特异性的跨年时间演化模式。

为应对这些局限性,我们提出**对比分层自适应元网络**(CHAM-net),这是一个新颖的框架,通过多年历史数据明确学习站点特异性动态。尽管许多站点特异性特征(如微生物群落和土壤性质)无法直接观测,其影响往往体现在各站点历史甲烷记录所显示的长期趋势中。因此,CHAM-net利用每个站点的历史甲烷数据来捕捉这些潜在特征,并改进当前年份的预测。具体而言,CHAM-net采用混合元学习机制 (Hospedales et al., 2021 (https://arxiv.org/html/2606.00338#bib.bib2)),其中内模型将多年环境和甲烷动态编码为可学习表示,以总结站点特异性特征(如时间模式和尺度),而外模型则利用这些学习到的表示来调节当前年份的预测过程。这种设计将预测从全局模型转变为站点感知的估计。此外,优化外循环有助于塑造内循环的学习任务,从而实现站点特异性信息的有效提取。

##### 与公益事业的关联。

通过应用我们先进的人工智能架构来解决甲烷生态系统的时空异质性,这项工作显著降低了自然甲烷预算中的不确定性,并增进了过程层面的理解,从而支持《全球甲烷承诺》 (Malley et al., 2023 (https://arxiv.org/html/2606.00338#bib.bib46)),实现更有效、更准确的甲烷减排策略。这些进展直接贡献于多个联合国可持续发展目标 (https://sdgs\.un\.org/goals),包括气候行动、良好健康与福祉、陆地生物,通过为近期气候减缓路径和空气质量预测提供信息,并支持可持续湿地管理。

本文与NOAA全球监测实验室、威斯康星大学麦迪逊分校、马里兰大学和普渡大学的领域专家积极合作完成,这些专家是全球甲烷观测、过程理解和大气数据同化领域的国际公认专家。这些科学家贡献了领域知识、观测约束条件,并在模型开发、训练和解释过程中评估了这些新方法的实际影响。

##### 技术贡献。

- ∙我们识别出站点异质性是当前模型预测不准确的关键因素,并表明历史数据编码了有效进行站点预测所必需的关键站点特异性信息。
- ∙我们提出CHAM-net,一种编码器-解码器混合元学习框架,能够动态利用历史数据来校准当前年份的站点特异性预测。
- ∙我们在广泛的甲烷排放和消耗数据集(包括模拟和观测数据)上评估了CHAM-net。实验结果表明,CHAM-net在所有数据集上持续优于所有基线,在FLUXNET排放数据集中达到了0.88的nRMSE和0.68的R²。

## 2 问题表述

全球甲烷通量预测的任务可以表述为站点层面的时间序列回归问题。对于每个站点 \(i \in \{1, \dots, N\}\),我们给定一段时间内环境驱动因素(如土壤性质和温度)的序列,记为 \(X_i = \{x_1, x_2, \dots, x_T\}\),其中每个 \(x_t \in \mathbb{R}^D\) 是时间 \(t\)(如具体日期)上的 \(D\) 维特征向量,\(D\) 是输入驱动因素的总数,\(T\) 是每个序列的长度。遵循先前甲烷预测和其他环境监测任务的工作 (Liu et al., 2024a (https://arxiv.org/html/2606.00338#bib.bib33); Sun et al., 2025 (https://arxiv.org/html/2606.00338#bib.bib20)),我们将数据切分为逐年序列(即 \(T = 365\)),以便于对季节模式进行建模。目标是预测相应年份的甲烷通量 \(Y_i = \{y_1, y_2, \dots, y_T\}\),其中 \(y_t \in \mathbb{R}\) 是目标标签,例如甲烷排放或消耗。在我们提出的方法中,我们还利用了多年的历史记录。对于每个站点 \(i\),我们用 \(X_i^{(k)}\) 和 \(Y_i^{(k)}\) 表示历史年份 \(k \in \{1, \dots, K\}\) 的环境驱动因素和甲烷数据。

本文使用的数据集可分为模拟数据集和观测数据集,各自特点如下:

- ∙**模拟数据集** 我们使用基于过程的模拟数据集,这些数据集通过求解微分方程将生物地球化学过程纳入模拟甲烷通量。借助全球可用的输入驱动因素,它们能够在全球尺度上估算甲烷通量。然而,由于模型计算的复杂性和多个输入驱动因素的不确定性,最高空间分辨率被限制在0.5度,对应每个网格约3000平方公里。
- ∙**观测数据集** 在观测数据集中,输入驱动因素和甲烷通量均通过涡度相关技术在每个站点直接测量,提供了真实世界的地面观测值。然而,这些站点在空间上稀疏且地理上不连续,覆盖范围约为数百平方米。此外,观测数据集的时间跨度明显短于模拟数据集。本文使用数据集的详细信息见第4.1节 (https://arxiv.org/html/2606.00338#S4.SS1)。## 3 设计与方法 在本节中,我们介绍CHAM-net(对比分层自适应元网络)架构的主要设计,该架构解决了上述问题,并利用历史信息来改进预测。 见图注 图2:CHAM-net结构概览。 ### 3.1 模型概述 提出的CHAM-net模型明确融入了历史信息,以学习站点特异性特征和长期动态。通过采用一种混合分层元学习架构,该模型为每个站点提取最具信息量的历史趋势和尺度。然后,这些学习到的站点特异性表示被注入解码器,并与当前年份输入相结合,以改进最终预测。图2 (https://arxiv.org/html/2606.00338#S3.F2) 展示了CHAM-net模型的整体架构。对于每个站点,可配置长度的历史年份数据用作**支持集**,而当前年份数据形成**查询集**。当历史年份长度超过一年时,首先应用交叉注意力模块计算每年与当前年份输入的相关性。然后利用注意力权重提取上下文感知的表示,捕捉影响当前年份动态的局部特征。这些表示随后传递到解码器阶段以指导最终预测。工作流程包含两个分层阶段: - ∙**上下文编码器**。上下文编码器旨在提取表示,以捕捉影响当前年份动态的站点特异性特征。尽管其中许多特征无法直接观测,但它们可以从甲烷通量 \(Y\) 对环境驱动因素 \(X\) 的动态响应中推断出来,即 \(Y = f(X; \theta)\)。上下文编码器的核心思想是**逆向**从历史甲烷数据中推断这些特征,通过将它们嵌入到作为函数 \(f\) 的参数 \(\theta\) 的站点特异性表示中。然而,直接将 \(\theta\) 推断为函数 \(f\) 的完整参数化可能无法精确捕捉站点特异性特征,因为映射还受到许多混杂因素的影响。因此,我们将模型 \(f\) 重新表述为 \(Y = f(g(X); \theta)\),其中 \(g\) 作为全局特征提取器(通过双向GRU),捕捉共享的潜在过程,而 \(\theta\) 参数化站点特异性信息。提取器 \(g\) 在监督训练下端到端学习,这有助于更好地定义和稳定目标任务的反向问题。进一步引入对比学习目标以放大站点间差异,确保站点特异性特征的区分性。 - ∙**自适应解码器**。得到的站点特异性表示随后被转换并注入基于长短期记忆网络(LSTM)(Hochreiter and Schmidhuber, 1997 (https://arxiv.org/html/2606.00338#bib.bib11)) 的解码器的隐藏状态中。解码器在所有站点间共享参数,但其时间动态条件取决于注入的站点上下文。甲烷通量的最终输出从这个上下文增强的隐藏状态中产生。 该模型通过双层优化过程进行训练。内循环优化旨在从历史数据观测中提取站点特异性表示。在外循环中,模型利用这些表示来调节和增强预测,同时更新模型参数以优化预测性能并塑造内循环目标。接下来,我们将提供模型组件以及训练过程的详细信息。 ### 3.2 上下文编码器

相似文章

面向类别不平衡的模型无关元学习适应方法

arXiv cs.CL

孟菲斯大学研究团队提出 HAMR——一种模型无关的元学习框架,通过双层优化与邻域感知重采样,在六个不平衡 NLP 数据集上自适应地为困难样本与少数类重新赋权。