TriHead-GAN:一种具有三头判别器的生成对抗网络,用于碳排放时间序列生成

arXiv cs.LG 论文

摘要

提出了TriHead-GAN,一种基于Transformer的GAN,其采用三头判别器,联合监督分布真实性、跨变量依赖性和时间平滑性,以生成逼真的碳排放时间序列,在多个数据集上优于基线方法。

arXiv:2606.07569v1 声明类型:新 摘要:准确的碳排放监测对于气候政策和新兴监管机制(如欧盟碳边境调节机制)至关重要,然而城市级别的高频监测数据仍然极度稀缺,严重限制了依赖数据量的深度学习模型。时间序列生成是一种自然的补救措施,但现有的生成对抗网络(GAN)和基于扩散的生成器通常对碳排放数据的域结构提供的显式监督有限:它们可能匹配边际分布统计量,但不足以保留CO$_2$与共排放污染物及气象因素之间的跨变量相关性,并且倾向于破坏大气测量的一阶差分统计量,生成的序列在平均意义上平滑,但缺乏底层信号中真实的逐步变异性。我们提出TriHead-GAN,一种基于Transformer的对抗框架,其三头判别器联合监督联合分布的三个互补方面:通过Wasserstein评判器监督分布真实性、通过无泄漏回归目标变量监督跨变量依赖性、以及通过相邻差分预测监督逐步时间平滑性。生成器结合了全局自注意力与局部时间卷积、每步噪声注入以及匹配一阶差分统计量的抗平滑损失。在自收集的长沙碳数据集、两个公共碳数据集(中国、美国)以及ETTh1基准上的实验表明,TriHead-GAN在绝大多数设置下均优于主流基线方法,且生成的合成窗口在低资源碳排放监测场景中提升了下游预测准确性。
查看原文
查看缓存全文

缓存时间: 2026/06/09 08:46

# TriHead-GAN:一种具有三头判别器的生成对抗网络,用于碳排放时间序列生成

来源:https://arxiv.org/html/2606.07569

王泽森,蓝丽娟\*,李永刚,杨春华

###### 摘要

准确的碳排放监测对于气候政策和新兴监管机制(如欧盟碳边境调节机制)至关重要,然而城市级的高频监测数据仍然极度稀缺,严重限制了数据密集型的深度学习模型。时间序列生成是一种自然的补救措施,但现有的GAN和扩散生成器通常对碳排放数据的领域结构提供的显式监督有限:它们可能匹配边际分布统计量,但未能充分保留CO₂与共排放污染物及气象因子之间的跨变量相关性,并且往往会导致大气测量的一阶差分统计量崩溃,产生平均上平滑但缺乏真实信号中逐步变化的序列。我们提出了TriHead-GAN,一种基于Transformer的对抗性框架,其三头判别器联合监督联合分布的三个互补方面:通过Wasserstein判别器监督分布真实性,通过目标变量的无泄漏回归监督跨变量依赖性,以及通过相邻差异预测监督逐步时间平滑性。生成器结合了全局自注意力与局部时间卷积、每步噪声注入以及匹配一阶差分统计量的抗平滑损失。在自行收集的长沙碳数据集、两个公开碳数据集(中国、美国)以及ETTh1基准上的实验表明,TriHead-GAN在绝大多数设置下取得了优于主流基线的性能,并且生成的合成窗口在低资源碳监测场景中提高了下游预测的准确性。

## I 引言

气候变化是人类面临的最紧迫挑战之一,其主要驱动因素是温室气体排放,特别是二氧化碳(CO₂)。《巴黎协定》旨在将全球气温升幅控制在比工业化前水平高2℃以下,并努力将升幅限制在1.5℃以内,这使得碳减排成为全球性的核心政策优先事项[27 (https://arxiv.org/html/2606.07569#bib.bib1)]。年度科学评估(如全球碳预算[9 (https://arxiv.org/html/2606.07569#bib.bib30)])和高分辨率排放清单(如EDGAR[3 (https://arxiv.org/html/2606.07569#bib.bib31)])记录了排放目标与观测趋势之间的持续差距。因此,准确的碳排放监测和预测对于碳交易市场、区域减排政策以及碳中和路径规划至关重要。除了科学意义,碳监测现在也与直接的经济后果紧密相连:欧盟的碳边境调节机制(CBAM)已于2026年1月1日进入最终实施阶段,根据该机制,授权的CBAM申报人必须每年申报其进口产品的隐含碳排放量,相应的证书义务将在随后几年逐步实施;当实际排放量无法充分确定时,将采用默认值,从而提高合规成本,这使得经过验证的高质量排放数据具有经济价值[6 (https://arxiv.org/html/2606.07569#bib.bib2),7 (https://arxiv.org/html/2606.07569#bib.bib3)]。因此,高质量、高分辨率的监测数据既是科学碳管理的前提,也是产业竞争力的前提,而这又依赖于建立在此类数据之上的可靠预测模型。

然而,此类预测模型的进展受到训练数据稀缺的瓶颈制约,这构成了一个具体的应用数据挖掘问题:城市级监测站很少积累足够的高频历史数据来训练现代深度学习模型,而下流的监管机构和政策制定者仍然需要可靠的预测流程。最近的深度学习方法[21 (https://arxiv.org/html/2606.07569#bib.bib17),11 (https://arxiv.org/html/2606.07569#bib.bib18),14 (https://arxiv.org/html/2606.07569#bib.bib10)]实现了强大的非线性建模,但仍然高度依赖数据的规模和质量,而公开可用的碳排放语料库(例如Carbon Monitor[20 (https://arxiv.org/html/2606.07569#bib.bib11)])大多在国家层面进行聚合,远远不足以满足数据密集型学习器的需求。与拥有数十年高频观测数据的气象或电力系统相比,城市尺度的碳排放监测面临着部署成本高、空间覆盖稀疏和历史记录有限的问题。最近出现的时间序列基础模型(如Sundial和TimeMoE[19 (https://arxiv.org/html/2606.07569#bib.bib12),26 (https://arxiv.org/html/2606.07569#bib.bib13)])进一步提高了数据门槛:针对碳排放的特定领域基础模型通常需要数百万个训练样本,使得数据稀缺成为进一步进展的根本障碍。因此,时间序列生成成为一种自然而实用的补救措施。

基于GAN的方法(例如TimeGAN[29 (https://arxiv.org/html/2606.07569#bib.bib5)]、TTS-GAN[17 (https://arxiv.org/html/2606.07569#bib.bib6)])和基于扩散的方法(例如Diffusion-TS[30 (https://arxiv.org/html/2606.07569#bib.bib7)])在通用时间序列生成任务中显示出有希望的性能。然而,当应用于碳排放场景时,两个实际问题仍未解决。首先,跨变量一致性不足:CO₂与共排放污染物(CO、NO₂、O₃)和气象因子(温度、湿度、气压)表现出强相关性,但现有的判别器主要评估整体样本的真实性,使得生成的样本在匹配边际分布的同时可能扭曲相关结构。其次,时间动态容易被扭曲:大气变量变化缓慢且连续,但基于Transformer的生成器倾向于通过全局注意力过度平滑,并且缺乏对局部变化的显式约束也可能产生不现实的突变。虽然以碳排放数据为基础,但这两个需求是大多数多元时间序列的通用属性:时间依赖既包括全局模式也包括局部突变,而跨变量依赖在于变量间的内部联合结构,而非仅边际分布。因此,我们直接针对这两个属性,并在通用ETTh1基准上验证了该框架。

为了解决上述问题,本文提出了TriHead-GAN,一种基于Transformer的对抗性框架,其具有专为多元碳排放时间序列生成定制的三头判别器。判别器将输入路由到三个并行的任务特定一维CNN分支,每个分支馈送给自己的头:**D-Head**通过Wasserstein目标评估分布真实性;**R-Head**通过从非目标变量对目标变量进行无泄漏回归约束跨变量依赖性;**T-Head**通过预测相邻步差强制大气参数的时间平滑性。生成器结合了自注意力与局部时间卷积和每步噪声注入,并通过匹配一阶差分统计量的抗平滑损失进行进一步正则化。我们在自行收集的长沙碳数据集、两个公开国家级数据集(中国碳、美国碳)以及ETTh1基准上评估了TriHead-GAN,观察到相对于有竞争力的基线的一致改进。

我们的主要贡献是:

- • 我们构建了**TriHead-GAN**,一种专门为数据稀缺下多元碳排放时间序列生成设计的基于Transformer的对抗性框架。
- • 我们提出了一种**三头判别器**,同时监督分布真实性、跨变量依赖性和逐步时间平滑性,提供了跨变量一致性感知的多方面监督。
- • 我们在自行收集的真实世界城市碳监测站和三个公开数据集上进行了系统的应用研究,评估了分布保真度、多样性、下游预测效用和部署成本,并显示出相对于六个有竞争力的基线的优越性能。

## II 相关工作

### II-A 碳排放预测

碳排放预测已从统计和机器学习模型发展到端到端深度学习以及基础模型方法[14 (https://arxiv.org/html/2606.07569#bib.bib10),21 (https://arxiv.org/html/2606.07569#bib.bib17),11 (https://arxiv.org/html/2606.07569#bib.bib18),22 (https://arxiv.org/html/2606.07569#bib.bib19)]。尽管不断进步,现有研究主要依赖来自Carbon Monitor[20 (https://arxiv.org/html/2606.07569#bib.bib11)]等平台的国家级数据,而城市级高频监测数据仍然严重稀缺。这一瓶颈促使我们专注于低资源碳监测场景下的高质量时间序列生成。

### II-B 时间序列生成

现有方法大致可分为两类:基于GAN的方法,通过对抗训练学习时间分布;以及基于扩散或似然的方法,通过去噪或潜变量推理对数据分布进行建模。

**基于GAN的方法。** RCGAN建立了循环条件生成和TSTR范式[5 (https://arxiv.org/html/2606.07569#bib.bib4)],TimeGAN增加了嵌入空间监督[29 (https://arxiv.org/html/2606.07569#bib.bib5)],TTS-GAN引入了基于Transformer的对抗生成[17 (https://arxiv.org/html/2606.07569#bib.bib6)]。最近的研究还表明,基于GAN的合成时间序列可以在数据稀缺情况下改善下游预测,并继续完善序列特征建模[2 (https://arxiv.org/html/2606.07569#bib.bib20),12 (https://arxiv.org/html/2606.07569#bib.bib21)]。

**基于扩散的方法。** TimeVAE通过变分自编码学习潜表示[4 (https://arxiv.org/html/2606.07569#bib.bib14)],而Diffusion-TS、PAD-TS和TimeDP使用去噪目标,并结合频域、群体感知和领域提示设计[30 (https://arxiv.org/html/2606.07569#bib.bib7),18 (https://arxiv.org/html/2606.07569#bib.bib15),13 (https://arxiv.org/html/2606.07569#bib.bib16)];更新的扩展进一步处理了不规则采样和图结构谱关系[8 (https://arxiv.org/html/2606.07569#bib.bib22),25 (https://arxiv.org/html/2606.07569#bib.bib23)]。

尽管通用性能强劲,但现有生成器通常强调样本真实性或去噪保真度,对领域特定的跨变量结构和逐步变化的显式监督有限。在碳排放场景中,合成窗口必须同时保留CO₂与气象/污染物变量之间的关系以及大气测量的真实一阶差分统计量。这激发了本文中所追求的专用判别器设计。

## III 方法论

### III-A 问题定义

给定一组真实的碳排放时间序列 \(\mathcal{X}=\{\mathbf{x}^{(i)}\}_{i=1}^N\),其中每个样本 \(\mathbf{x}^{(i)} \in \mathbb{R}^{T \times F}\) 是一个长度为 \(T\)、包含 \(F\) 个特征变量的窗口,我们的目标是学习一个生成模型 \(G\),使其能够从随机噪声 \(\mathbf{z} \sim \mathcal{N}(0, \mathbf{I})\) 生成合成窗口 \(\hat{\mathbf{x}} = G(\mathbf{z}) \in \mathbb{R}^{T \times F}\),满足三个标准:(1) **分布一致性**(生成分布 \(p_G\) 应近似真实数据分布 \(p_{\text{data}}\));(2) **跨变量一致性**(变量间的相关性应符合底层领域结构);(3) **时间连贯性**(变化率和平滑度应与真实序列匹配)。

### III-B 整体框架

TriHead-GAN由一个基于Transformer的生成器和一个三头判别器组成(图1 (https://arxiv.org/html/2606.07569#S3.F1))。

**基于Transformer的生成器 \(G\)。** 它以随机噪声 \(\mathbf{z} \in \mathbb{R}^{T \times d_z}\) 作为输入,应用线性投影、正弦位置编码和Transformer编码器来提取全局时间依赖,随后通过局部时间卷积模块处理细粒度的局部动态,并采用每步噪声注入来增强时间多样性,最终生成合成片段 \(\hat{\mathbf{x}} \in \mathbb{R}^{T \times F}\)。

**三头判别器 \(D\)。** 它将时间序列片段(真实或生成)作为输入,并将其路由到三个任务特定的头,每个头由自身并行的CNN分支馈送。**D-Head** (\(D_d\)) 在具有谱归一化[23 (https://arxiv.org/html/2606.07569#bib.bib25)]的专用三层一维CNN之上充当Wasserstein判别器。**R-Head** (\(D_r\)) 拥有自己的三层CNN分支,仅接收非目标特征,为跨变量回归提供无泄漏输入。**T-Head** (\(D_t\)) 采用独立的双层因果CNN分支,通过预测相邻步差来强制时间连贯性。

### III-C 基于Transformer的生成器

生成器 \(G\) 以Transformer编码器为主干,辅以局部时间卷积和每步噪声注入。

**输入投影。** 每个时间步的噪声向量从噪声维度 \(d_z\) 线性映射到模型维度 \(d_{\text{model}}\):
\[\mathbf{h}_0 = \text{Linear}(\mathbf{z}) \in \mathbb{R}^{T \times d_{\text{model}}}.\]

**位置编码。** 正弦位置编码[28 (https://arxiv.org/html/2606.07569#bib.bib8)]注入绝对时间信息:
\[\begin{aligned}
\text{PE}(t, 2k) &= \sin\left(t/10000^{2k/d_{\text{model}}}\right), \\
\text{PE}(t, 2k+1) &= \cos\left(t/10000^{2k/d_{\text{model}}}\right).
\end{aligned}\]
注入位置的特征为 \(\mathbf{h}_1 = \text{Dropout}(\mathbf{h}_0 + \text{PE})\)。

**Transformer编码。** 输入经过 \(L\) 个Transformer编码器层,每层包括多头自注意力(MHA)和前馈网络(FFN),因此 \(\mathbf{h}_{l+1} = \text{TransformerEncoderLayer}(\mathbf{h}_l)\),其中 \(l = 1, \dots, L\)。自注意力机制使生成器能够感知所有时间步的信息,捕捉碳排放数据中的周期性模式和长程依赖。

**局部时间卷积。** Transformer的全局注意力倾向于使输出过度平滑并丢失细粒度的局部变化。我们在编码器之后添加了一个两层一维卷积模块,并带有残差连接:
\[\begin{aligned}
\mathbf{h}_{\text{local}} &= \text{Conv1d}_2(\text{GELU}(\text{Conv1d}_1(\mathbf{h}_{L+1}))), \\
\mathbf{h}' &= \mathbf{h}_{L+1} + \mathbf{h}_{\text{local}},
\end{aligned}\]
其中Conv1d使用核大小为3且填充以保持序列长度。

**每步噪声注入。** 在训练过程中,我们

相似文章

跨尺度对齐监督训练GANs

Hugging Face Daily Papers

本文提出CAT,一种跨尺度对齐变换器,通过强制中间GAN输出与最终输出之间的一致性来解决轨迹错位问题,在ImageNet-256上实现了1.56的最优FID。

使用最优传输改进 GANs

OpenAI Blog

OT-GAN 提出了一种新颖的 GAN 变体,在对抗学习的特征空间中结合最优传输和能量距离,以提高训练稳定性和图像生成质量。该方法在基准问题上展示了最先进的结果,使用大批量数据实现了稳定的训练。

REGEN: 面向预测的参考引导型多元时间序列合成生成

arXiv cs.LG

ReGeN是一个参考引导的生成流水线,用于多元时间序列数据。它将观测序列分解为周期性骨干、随机残差和跨变量依赖关系,以合成可控的合成数据。结果表明,生成的数据可以替代真实数据用于预测任务,且性能优于以往的合成数据生成器。