EnergyMamba:一种面向能源消耗预测的、具有不确定性意识的图增强选择性状态空间模型
摘要
EnergyMamba提出了一种新颖的时空框架,将图增强选择性状态空间模型与自适应共形分位数回归相结合,实现准确可靠的能源消耗预测并给出不确定性估计,在佛罗里达、纽约和加利福尼亚的真实数据集上取得了性能提升。
arXiv:2606.00506v1 公告类型:新
摘要:能源消耗预测对于高效的电网管理、需求侧优化和可持续能源规划至关重要。尽管先进的机器学习方法已被用于提升预测性能,但现有工作存在两个关键局限性:(1)它们通常将该任务视为纯时间序列预测问题,而没有显式建模不同区域间的空间依赖关系;(2)在异常情况(如极端天气事件)下,它们无法提供带有不确定性估计的可靠预测。为推进现有研究,我们提出EnergyMamba,一种具有不确定性意识的时空学习框架,用于准确可靠的能源消耗预测,包含两个关键组件:(i)一种新颖的图增强选择性状态空间模型(GE-Mamba),将从电网拓扑中学到的空间上下文注入时间动态中,实现耦合的时空建模;(ii)自适应序列共形分位数回归(AS-CQR)模块,包括局部自适应归一化和在线反馈机制,以在潜在分布偏移下动态校准预测区间。我们在佛罗里达、纽约和加利福尼亚的四个大规模真实数据集上评估EnergyMamba。结果表明,与15个最先进的基线相比,EnergyMamba在预测精度上提高了约5%,在不确定性量化上提高了6%。
查看缓存全文
缓存时间: 2026/06/02 15:47
# EnergyMamba: 一种面向能源消耗预测的不确定性感知图增强选择性状态空间模型 来源: https://arxiv.org/html/2606.00506 Rongchao Xu 佛罗里达州立大学 美国佛罗里达州塔拉哈西 [email protected] (https://arxiv.org/html/2606.00506v1/mailto:[email protected]) Lin Jiang 佛罗里达州立大学 美国佛罗里达州塔拉哈西 [email protected] (https://arxiv.org/html/2606.00506v1/mailto:[email protected]) Guang Wang 佛罗里达州立大学 美国佛罗里达州塔拉哈西 [email protected] (https://arxiv.org/html/2606.00506v1/mailto:[email protected]) (2026) ###### 摘要 能源消耗预测对于高效的电网管理、需求侧优化以及可持续能源规划至关重要。尽管先进机器学习方法已被用于提升预测性能,但现有工作存在两个关键局限:(1) 它们通常将该任务纯粹视为时间序列预测问题,而未显式建模不同区域间的空间依赖关系;(2) 在极端天气事件等异常情况下,它们无法提供带有不确定性估计的可靠预测。为推进现有研究,我们提出了 EnergyMamba——一个用于准确可靠能源消耗预测的不确定性感知时空学习框架。它包含两个关键组件:(i) 新型图增强选择性状态空间模型 (GE-Mamba),该模型将从电网拓扑中学习到的空间上下文注入到时间动态中,实现耦合的时空建模;(ii) 自适应序列共形分位数回归 (AS-CQR) 模块,该模块包含局部自适应归一化和在线反馈机制,能够在潜在分布偏移下动态校准预测区间。我们在来自佛罗里达州、纽约州和加利福尼亚州的四个大规模真实世界数据集上评估了 EnergyMamba。结果表明,与15个最先进基线相比,EnergyMamba在预测精度上提升了约5%,在不确定性量化上提升了6%。 不确定性量化,状态空间模型,能源消耗预测 ††期刊年份:2026 ††版权:cc ††会议:第32届ACM SIGKDD知识发现与数据挖掘会议 V.2; 2026年8月9–13日; 韩国济州岛 ††论文集:第32届ACM SIGKDD知识发现与数据挖掘会议 V.2 (KDD ’26), 2026年8月9–13日, 韩国济州岛 ††DOI:10.1145/3770855.3818841 ††ISBN:979-8-4007-2259-2/2026/08 ††CCS:信息系统 → 时空系统 ††CCS:信息系统 → 数据挖掘 ## 1. 引言 能源消耗预测因其在支持具有重大社会影响的广泛实际应用中的关键作用,已引起工业界和学术界的广泛关注。准确可靠的能源消耗预测对于高效的电网管理 (Jha et al., 2021)、需求侧优化 (Binbusayyis and Sha, 2025) 和可持续能源规划 (Peteleaza et al., 2024) 至关重要。它还有助于应急准备 (Zhong and Sun, 2010),帮助相关方在极端天气事件期间预判可能的能源消耗激增,确保电网的稳定性和韧性。鉴于其实际重要性,人们已采用多种方法研究能源消耗预测,包括传统统计模型 (Pun et al., 2019; Alghamdi et al., 2019)、经典机器学习方法 (Deng et al., 2026; Lim et al., 2021; Li et al., 2022; Piccialli et al., 2020)、通用深度学习方法 (Bouktif et al., 2020; Yu et al., 2025, 2026b)、Transformer (Alexandrov et al., 2020; Zeng et al., 2023) 以及扩散模型 (Jiang et al., 2025a, b)。最近,基础模型 (Tu et al., 2024) 和大语言模型 (LLM) (Li et al., 2024a; Zhang et al., 2026; Liang et al., 2025) 也被探索用于建模复杂能源系统。然而,现有工作存在两个关键局限。首先,大多数现有工作将能源消耗预测表述为纯时间序列预测问题,忽略了不同区域或电网区域之间可能为准确预测提供关键上下文信息的固有空间依赖关系。其次,最先进的方法无法持续提供带有不确定性估计的可靠预测,尤其是在极端天气事件等异常情况下,导致预测过于自信且可能具有误导性。在这项工作中,我们旨在开发一个用于能源消耗预测的不确定性感知时空框架,该框架显式建模空间依赖关系,同时提供可靠的不确定性估计。然而,实现这一目标存在两个关键挑战。首先,能源消耗模式与地理因素、时间因素和建筑特征(例如,商业 vs. 住宅)存在强相关性。这些特征导致跨区域和跨时间段的消耗模式高度异质,使得现有模型难以有效捕捉细粒度的时空依赖关系。其次,在极端事件期间,能源消耗行为和需求分布可能发生剧烈变化,这使得持续提供可靠的预测和不确定性估计变得具有挑战性。为应对上述挑战并推进现有研究,我们提出了 EnergyMamba,一个用于准确可靠能源消耗预测的不确定性感知时空学习框架。首先,为解决时空异质性挑战,我们在 EnergyMamba 中设计了**图增强选择性状态空间模型 (GE-Mamba)**,这是一种新颖的架构,它将从电网拓扑中学习到的空间上下文注入到双向 Mamba 中,并组织在 U-Net 结构内。GE-Mamba 利用图卷积网络从电网拓扑中提取空间上下文,并将此上下文直接注入到高效的选择性状态空间模型中以进行时间动态建模。该设计受基尔霍夫电路定律启发:一个节点的消耗变化通过潮流方程传播到相连节点,因此在空间上下文上条件化时间动态能够实现更精确的建模。其次,为解决不确定性量化挑战,我们提出了**自适应序列共形分位数回归 (AS-CQR)**。与假设数据可交换的标准共形预测不同,AS-CQR 专为非平稳时间序列设计。它包括 (i) 一种局部自适应非一致性度量,通过预测区间宽度对残差进行归一化,确保跨区域尺度不变的校准,以及 (ii) 一种在线反馈机制,根据最近的覆盖性能动态调整目标分位数水平,实现对分布偏移的快速适应。本文的主要贡献如下: - **概念上**,与现有将能源消耗预测视为纯时间序列预测问题的工作不同,我们将其表述为不确定性感知的时空预测任务,并进行显式的空间依赖性建模和可靠的不确定性量化。 - **技术上**,我们提出了 EnergyMamba,一个不确定性感知的时空学习框架,包括:(i) GE-Mamba,一种新颖的架构,它将从电网拓扑中学习到的空间上下文注入到双向 Mamba 中,并组织在 U-Net 结构内;(ii) AS-CQR,一种无分布的不确定性量化方法,具有局部自适应归一化和在线反馈校准功能,可在非平稳条件下实现可靠预测。 - **实证上**,我们在来自佛罗里达州、纽约州和加利福尼亚州的四个真实世界数据集上,与15个最先进基线在五个指标上进行比较,评估了 EnergyMamba。大量结果表明,EnergyMamba 在预测精度上比最佳基线提高了约5%,在不确定性量化上提高了6%。我们的实现可在 https://github.com/UFOdestiny/EnergyMamba 获取。 ## 2. 数据分析与动机 在本节中,我们进行数据驱动分析,以突出激发我们设计的关键发现。关于数据收集、预处理和管理程序的更详细描述见附录A (https://arxiv.org/html/2606.00506#A1)。 ### 2.1. 数据描述 在本项目中,我们与佛罗里达州的一家市政公用事业提供商合作。我们可以访问从佛罗里达州莱昂县超过60,000个智能电表收集的公用事业数据。该数据提供30分钟间隔的家庭级能源消耗时间序列。原始数据在人口普查区块组 (CBG) 级别聚合,以防止披露个人身份信息并保护用户隐私。 ### 2.2. 数据驱动洞察 #### 2.2.1. 空间自相关与局部异质性 我们使用 Moran's I 统计量 (Moran, 1950) 对 CBG 级别的能源消耗进行全局和局部空间自相关分析。图1(a) 可视化了一个 CBG 自身状态与其相邻 CBG 状态之间的关系,其中 \(z_i\) 表示第 \(i\) 个 CBG 的标准化平均负载,而空间滞后 (\(Wz_i\)) 表示其相邻 CBG 的加权平均负载,该负载使用行归一化空间权重矩阵 \(W\) 计算。该图将数据分为四个象限,反映不同的局部空间相关性:(1) **高-高** 和 **低-低** 表示空间聚类,其中 CBG 与其邻居共享相似模式(正相关);(2) **高-低** 和 **低-高** 突出显示空间分散,其中 CBG 与其周边环境偏离(负相关)。图1(a) 中 Moran's I 图的拟合斜率为0.429 (p<0.001),表明统计上显著的正空间自相关。从物理系统角度来看,这种空间依赖性并非偶然,而是源于基本的电路约束。具体而言,基尔霍夫电流定律强制节点功率平衡,这意味着 CBG 处的局部负载扰动必须通过相邻链接重新分配。这种重新分配沿着网络拓扑传播,在电气相连的邻居处引起相关的负载偏差。  Moran's I 散点图。  LISA 聚类图。 图 1. 空间自相关。**高-低** 表示高消耗 CBG 被低用量邻居包围。两个面板总结了佛罗里达州数据中的空间自相关:左侧为 Moran's I 散点图,右侧为 LISA 聚类图。 除了全局相关性,图1(b) 将这些统计关联投射到物理区域以揭示局部异质性。(**高-高/低-低**):高-高聚类与密集的 urban 核心区域对齐,反映了潜在的电气耦合,而低-低聚类则主导着连接稀疏的农村边缘区域。(**高-低/低-高**):该图还识别出违背全局趋势的空间区域。例如,高-低节点可能标识一个包含集中商业或工业负载(例如购物中心或医院区)的 CBG,周围环绕着密度较低的住宅小区。这些拓扑不匹配对纯时间序列模型构成挑战,但为空间感知模型提供了有意义的信号,以区分正常波动和特定负载类型。  负载-残差缩放。  局部自适应归一化。 图 2. 能源消耗预测中的不确定性。两个面板说明了不确定性行为:左侧为负载-残差缩放,右侧为局部自适应归一化的效果。 #### 2.2.2. 异方差不确定性随负载幅度变化 图2(a) 揭示了平均小时负载与预测残差标准差之间的强线性关系 (r=0.94),这表明异方差性,即电力消耗的变异性并非恒定,而是与使用量成正比;基线负载较高的区域自然表现出更大的绝对波动和预测误差。如图2(b) 所示,这种尺度依赖性导致原始绝对残差分布在不同的负载层级间存在显著差异。通过用各自的局部标准差对这些残差进行归一化,低、中、高负载组之间的分布几乎重合为一条相同的曲线。这种变换稳定了方差,有效地将异方差误差转化为适用于标准化分析的尺度无关分布。 这些洞察突出了能源消耗建模和预测的两个基本要求。首先,强烈的**空间依赖性**意味着预测应考虑邻近区域之间的交互。其次,观察到的异方差性和非平稳性表明,不确定性估计必须适应**变化的负载水平和分布偏移**。 ## 3. 问题形式化 ### 3.1. 图构建 我们将能源系统建模为图 \(\mathcal{G}=(\mathbf{V}, \mathbf{E}, \mathbf{A})\),其中 \(\mathbf{V}=\{v_1,\ldots,v_N\}\) 表示 \(N\) 个节点(例如,人口普查区块组或县),\(\mathbf{E}\) 是通过空间邻近性构建的边集以近似物理耦合,而 \(\mathbf{A}\in\mathbb{R}^{N\times N}\) 是加权邻接矩阵。我们使用带有稀疏性阈值的 Gaussian 核构建 \(\mathbf{A}\): (1) \[ \mathbf{A}_{ij}= \begin{cases} \exp\!\left(-d_{ij}^2/\sigma^2\right), & i\neq j\text{ and }\exp\!\left(-d_{ij}^2/\sigma^2\right)\geq\epsilon,\\[4.0pt] 0, & \text{otherwise}, \end{cases} \] 其中 \(d_{ij}\) 是节点 \(v_i\) 和 \(v_j\) 之间的质心距离,\(\sigma>0\) 控制空间衰减,\(\epsilon\in[0,1]\) 是去除弱连接的稀疏性阈值。 ### 3.2. 能源消耗预测 令 \(\mathbf{X}\in\mathbb{R}^{N\times T}\) 表示包含所有 \(N\) 个节点在 \(T\) 个历史时间步上的能源消耗读数的输入矩阵。给定历史观测值 \(\mathbf{X}\) 和邻接矩阵 \(\mathbf{A}\),目标是预测
相似文章
用于真实数据能耗预测校正的 Ensemble Score Filtering
本文提出使用 Ensemble Score Filter (EnSF)(一种基于评分的扩散数据同化方法),利用部分含噪声的观测数据来校正预训练的时空能耗模型的预测。数值实验表明,EnSF 在状态估计上显著优于开环传播,并且在非线性观测条件下优于集成卡尔曼滤波(Ensemble Kalman Filter)。
建模时空图异常检测中的频谱能量偏移
提出了一种节点级频谱能量公式,用于检测图中的伪装异常,并将其扩展到具有能量驱动消息传递的时空设置。在大规模基准测试上证明了其有效性。
PIMSM: 物理信息驱动的多尺度Mamba:分布偏移下稳定的神经表示
本文提出物理信息驱动的多尺度Mamba(PIMSM),这是一种状态空间架构,它将模型记忆与物理时间尺度对齐,以提升在科学时间序列分布偏移下的鲁棒性,并在fMRI和天气预报任务上展示了改进。
EnergyLens: 面向多GPU大语言模型推理优化的预测性能耗感知探索
EnergyLens是一个端到端的框架,用于多GPU大语言模型推理的预测性能耗感知优化,在Llama3和Qwen3-MoE上验证,平均绝对百分比误差在9.25%至13.19%之间,并揭示了不同配置之间显著的能耗差异。
基于能量的模型的隐式生成和泛化方法
OpenAI 提出了基于能量的模型 (EBM) 的隐式生成和泛化方法,该方法使用 Langevin 动力学进行迭代优化以生成样本,无需显式生成器网络。该方法具有多个优势,包括自适应计算时间、学习不连通数据模式的灵活性,以及通过专家乘积实现的内置组合性。