CALAD: 通道感知对比学习用于多变量时间序列异常检测

arXiv cs.LG 论文

摘要

提出了CALAD,一个用于多变量时间序列异常检测的通道感知对比学习框架,该框架利用估计的通道相关性构建对比样本,实现了最先进的性能。

arXiv:2605.23139v1 公告类型:新 摘要:多变量时间序列异常检测在实际应用中变得越来越重要,而标注数据往往稀缺。许多现有方法依赖无监督学习来建模正常模式,但它们通常将所有通道同等对待。这种设计可能会稀释与异常相关的信号,因为并非所有通道对异常检测都有相同贡献。在本文中,我们提出了CALAD,一个用于多变量时间序列异常检测的通道感知对比学习框架。CALAD利用估计的通道相关性来指导对比样本的构建,使学习过程能够反映异常语义而非通用相似性。通道相关性通过基于Transformer的自编码器的重构误差进行估计,并用于区分对异常行为影响更大的通道。利用这些信息,我们设计了一种通道级增强策略,其中正样本和负样本的构建取决于是否保留或扰动异常相关通道。这鼓励对无关通道的变化保持不变性,同时对异常相关通道的变化保持敏感性。此外,CALAD结合了对比学习和辅助重构头,使模型能够学习判别性表示,同时保留正常结构。在多个真实数据集上的实验表明,CALAD始终优于现有方法,特别是在分布偏移场景下。我们在https://github.com/hirundo1218/CALAD提供代码以供复现。
查看原文
查看缓存全文

缓存时间: 2026/05/25 09:01

# CALAD:面向多元时间序列异常检测的通道感知对比学习
来源:https://arxiv.org/html/2605.23139
11电子工程系,仁荷大学,仁川,韩国
11邮件:jaehyeop\.hong@inha\.edu, youngbum\.hur@inha\.ac\.kr###### 摘要

多元时间序列异常检测在现实应用中日益重要,但标记数据往往稀缺。现有方法多依赖无监督学习来建模正常模式,但它们通常将所有通道同等对待。由于并非所有通道对异常检测的贡献相同,这种设计会稀释异常相关信号。本文提出 CALAD,一种用于多元时间序列异常检测的通道感知对比学习框架。CALAD 利用估计的通道相关性来指导对比样本的构建,使学习过程能够反映异常语义而非通用相似性。通道相关性通过基于 Transformer 的自编码器的重构误差进行估计,并用于区分对异常行为影响更大的通道。基于此信息,我们设计了一种通道级增强策略,其中正样本和负样本的构建取决于异常相关通道是被保留还是被扰动。这促使模型对无关通道的变化保持不变性,同时对异常相关通道的变化保持敏感。此外,CALAD 将对比学习与辅助重构头相结合,使模型在学习判别性表示的同时保留正常结构。在多个真实数据集上的实验表明,CALAD 始终优于现有方法,尤其是在分布偏移场景下。我们提供可复现的代码:https://github\.com/hirundo1218/CALAD

## 1 引言

随着人工智能时代数据收集的重要性日益增长,各种传感器被广泛使用,产生了大量时间序列数据[3 (https://arxiv.org/html/2605.23139#bib.bib31)]。在大规模时间序列数据中检测异常在现实场景中至关重要,因为它能增强系统可靠性、支持预测性维护并减少潜在损失。时间序列异常检测已应用于多个领域,包括工业控制系统[11 (https://arxiv.org/html/2605.23139#bib.bib32)]、航空航天系统[7 (https://arxiv.org/html/2605.23139#bib.bib33)]和服务器监控[15 (https://arxiv.org/html/2605.23139#bib.bib23)]。

基于深度学习的异常检测因其在建模复杂多元时间序列方面的有效性而受到越来越多的关注[3 (https://arxiv.org/html/2605.23139#bib.bib31)]。这些方法通常根据标注数据的可用性进行分类。在实践中,时间序列数据集通常包含很少的标注异常或完全没有标注,这使得无监督方法特别具有吸引力。其中,对比学习通过直接从数据中构建监督信号(无需异常标注)而成为一种强大的范式[2 (https://arxiv.org/html/2605.23139#bib.bib26),21 (https://arxiv.org/html/2605.23139#bib.bib36)]。

尽管取得了进展,无监督多元时间序列异常检测仍然具有挑战性。在实践中,并非所有通道对异常检测的贡献相同,将所有通道等同对待可能会稀释异常相关的模式。如图1 (https://arxiv.org/html/2605.23139#S1.F1) 所示,不同通道表现出不同的时间模式以及与异常的不同关联程度,这凸显了建模通道特定角色的必要性。

![图1:来自 MSL(T-4) 数据集的一个示例,显示每个通道展现出不同的时间模式以及与异常不同的相关性程度。](图1标题)

基于这些观察,我们提出了 CALAD,一个*通道感知异常检测框架*,它将估计的通道相关性显式地融入对比学习过程。CALAD 不是将通道重要性视为静态权重或注意力机制,而是使用通道相关性直接指导对比样本的构建方式。具体来说,通道相关性通过重构误差进行估计,这些信息决定了在形成正样本和负样本时,通道是应该被保留还是被扰动。因此,对比学习受到异常语义的引导,促使模型对无关通道的变化保持不变性,同时对异常相关通道的扰动保持敏感。此外,CALAD 通过显式的重构目标来增强对比学习,确保在表示学习过程中保留正常的时间结构。

我们的主要贡献总结如下:

- • 我们提出了一种通道感知的异常检测框架,该框架利用重构误差作为异常指标,无需使用异常标签即可估计异常相关通道。
- • 我们引入了一种通道级对比增强策略,其中正样本和负样本的构建基于异常相关通道是被保留还是被扰动,从而使对比学习与异常语义对齐。
- • 我们将对比学习与 Transformer 编码器及辅助重构头相结合,使模型在学习判别性表示的同时保留正常的时间结构。

## 2 相关工作

### 2.1 时间序列异常检测

时间序列异常检测旨在识别偏离正常系统行为的观测值。早期方法依赖于统计[20 (https://arxiv.org/html/2605.23139#bib.bib43)]、基于聚类[12 (https://arxiv.org/html/2605.23139#bib.bib44)]和基于距离的方法[22 (https://arxiv.org/html/2605.23139#bib.bib45)]。最近,基于深度学习的方法变得普遍,尤其是在标注异常稀缺的无监督设置中。许多近期研究采用自监督学习(SSL)来建模正常模式,无需异常标注。根据最近的综述[25 (https://arxiv.org/html/2605.23139#bib.bib1)],时间序列的 SSL 方法主要分为基于生成和基于对比的方法。生成方法包括基于自回归的预测(如 THOC[14 (https://arxiv.org/html/2605.23139#bib.bib2)])和基于自编码器的重构(如 DAEMON[1 (https://arxiv.org/html/2605.23139#bib.bib3)]),而有些方法(如 MTAD-GAT[26 (https://arxiv.org/html/2605.23139#bib.bib50)])则结合了这两种范式。对比方法,包括 TS2Vec[23 (https://arxiv.org/html/2605.23139#bib.bib48)]、DCdetector[21 (https://arxiv.org/html/2605.23139#bib.bib36)] 和 CARLA[2 (https://arxiv.org/html/2605.23139#bib.bib26)],通过学习增强视图的判别性表示而表现出色。除了这些学习范式,还探索了各种神经架构来捕获多元时间序列中的时间依赖性,包括 RNN、CNN、自编码器和 Transformer[3 (https://arxiv.org/html/2605.23139#bib.bib31)]。特别是,基于 Transformer 的模型因其捕获长距离依赖的能力而受到关注,如 Anomaly Transformer[19 (https://arxiv.org/html/2605.23139#bib.bib40)]、TranAD[16 (https://arxiv.org/html/2605.23139#bib.bib4)] 和 DDDM[17 (https://arxiv.org/html/2605.23139#bib.bib27)] 所示。然而,大多数方法在表示学习和增强过程中将所有通道统一对待,这可能限制了它们捕获通道特定异常特征的能力。

### 2.2 时间序列中的特征选择

特征和通道选择被广泛研究,以提高多元时间序列分析的鲁棒性和可解释性。许多方法包括统计标准,如相关性分析、基于方差的测量和互信息来识别信息通道[6 (https://arxiv.org/html/2605.23139#bib.bib54)],以及稀疏性诱导正则化技术,如 LASSO,通过将不重要变量的系数设为零来自动选择相关变量[8 (https://arxiv.org/html/2605.23139#bib.bib55)]。在异常检测中,已经探索了特征选择以减少无关通道的影响[9 (https://arxiv.org/html/2605.23139#bib.bib56)]。然而,在无监督环境中,由于缺乏异常标签,识别与异常行为更相关的通道仍然具有挑战性。此外,通道重要性通常仅用于加权或选择,而未显式指导学习过程中应如何构建表示或增强视图。这些局限性促使我们超越将通道选择作为预处理步骤的方法,而是利用通道相关性直接指导表示学习的方式,尤其是在多元时间序列的对比学习中。

## 3 方法

### 3.1 问题定义

在我们的任务中,多元时间序列 X = {x1, x2, …, xT} ∈ ℝ^(T×C) 表示一个多变量时间点的序列,其中每个 xt ∈ ℝ^C 是时间 t 的观测值,T 是时间步数,C 是通道数。模型的输入是一个滑动窗口 wi = {xi, xi+1, …, xi+ws-1},其中 ws 表示窗口大小。为方便表示,我们使用 xi,c 和 wi,c 来指代第 c 通道的时间点和窗口。N 是窗口数量。我们的任务是检测给定的多元时间序列窗口是否包含异常。真值标签记为 yi,其中 yi=0 表示正常窗口,yi=1 表示异常窗口。

### 3.2 总体框架

CALAD 的总体框架如图2 (https://arxiv.org/html/2605.23139#S3.F2) 所示。CALAD 被设计为一种通道感知的对比学习流程,其中估计的通道相关性指导对比样本的构建和学习方式。为此,该框架包括四个阶段:用于对比增强的通道相关性估计、通道感知的正负样本对构建、最近邻搜索和结构保持的对比学习。

![图2:CALAD 的总体框架:我们首先使用重构误差执行 LASSO 回归,以估计用于对比增强的通道相关性。基于估计的相关性,通过基于逆 FFT 的增强生成正负样本。这些样本被嵌入到表示空间中,在该空间中识别每个锚点(原始)窗口的最近和最远邻居。这三个窗口通过一个 Transformer 编码器,后跟一个基于 MLP 的重构头。模型通过对比损失和重构损失联合优化。](图2标题)

### 3.3 用于对比增强的通道相关性估计

在本研究中,我们通过分析每个通道对重构误差的贡献程度来估计其与异常行为的相关性。目标并非精确识别异常相关通道,而是粗略地将对异常行为贡献较大的通道与影响很小的通道分开。这种粗略的分离对于指导通道感知的对比增强已经足够。为此,我们使用 LASSO 回归作为估计工具。LASSO(最小绝对收缩和选择算子)对回归系数 β 施加 L1 惩罚,通过将不太重要的系数压缩到零来鼓励稀疏性,从而消除无关变量。给定多元时间序列数据 X 和响应变量 y,回归系数通过求解以下优化问题获得:

β̂ = argmin_β (‖y - Xβ‖_2^2 + λ‖β‖_1)   (1)

其中 λ 控制稀疏程度。β̂ 中具有非零系数的通道被认为与异常行为更相关。在无监督设置中,异常标签不可用。因此,我们使用重构误差作为响应变量 y。基于重构模型的重构误差可以作为异常指标,因为它反映了训练期间捕获的正常时间模式之外的偏差。其值能解释重构误差变化的通道可以被解释为对异常行为更敏感。具体来说,我们训练一个基于 Transformer 的自编码器以重构所有通道的数据。使用训练好的模型,计算跨通道的重构误差,其中 x̂i,c 表示重构数据:

ei,c = ‖xi,c - x̂i,c‖,    yi = (1/C) ∑_(c=1)^C ei,c   (2)

然后使用原始多元输入作为预测变量,重构误差作为响应变量进行 LASSO 回归。具有非零系数的通道被视为异常相关,而零系数通道则被视为异常无关。图4(a)(https://arxiv.org/html/2605.23139#S3.F4.sf1)(a) 展示了 LASSO 系数的一个示例。在 55 个通道中,只有 9 个具有非零系数,其余 46 个通道系数为零,表明大多数通道被估计为与异常行为无关。图4(a)(https://arxiv.org/html/2605.23139#S3.F4.sf1)(b) 比较了具有非零系数和零系数的通道,说明具有非零系数的通道与异常行为的关联性大于零系数通道。

(a) MSL(F-5) 数据集上的通道相关性估计。

### 3.4 通道感知的正负样本对构建

时间序列数据在增强时需要谨慎处理,因为不适当的变换可能会扭曲内在的时间模式。在时间序列增强中常用的做法是跨所有通道应用统一变换,这可能会无意中扭曲异常相关通道中的重要模式,从而降低与异常相关的表示质量。

为了解决这个问题,我们通过根据通道与异常的估计相关性来选择性地变换通道来构建对比样本。正样本通过扰动异常无关通道同时保留异常相关通道来生成,从而保留与异常相关的正常模式,并学习多样化的正常表示。相反,负样本通过扰动异常相关通道同时保持异常无关通道不变来生成,这会破坏与异常相关的正常模式,导致这些视图被视为异常表示。这种通道感知的设计减少了来自无关通道的表示偏差,并鼓励模型专注于异常相关信号。

我们使用逆 FFT 扰动来实现所提出的通道感知构建。被估计为异常相关的非零系数通道仅在生成负样本时被扰动,而零系数通道仅在生成正样本时被扰动。

相似文章

桥接分类与重建:协同时间序列异常检测

arXiv cs.LG

本文提出CoAD,一种新颖的框架,统一了异常暴露(分类)和掩码自编码器(重建)两种范式用于时间序列异常检测,解决了它们各自的局限性。大量实验表明,CoAD在轻量快速的同时,显著优于现有最先进方法。

多变量时间序列基准中的异常大多数是单变量的

arXiv cs.LG

本文介绍了一种用于多变量时间序列异常检测基准的诊断框架,发现标记的异常大多可以从单个通道检测到,这对跨通道建模的必要性提出了挑战。作者呼吁开发更多结构多样的评估数据集。