检测不可检测之异常:通过主动学习增强无监督时间序列异常检测
摘要
提出一种新框架,结合主动学习、掩码重构与极小极大策略,以改进无监督时间序列异常检测。在28个测试案例中,相较于基线模型,AUC提升12.39%。
arXiv:2607.00720v1 公告类型:新发布
摘要:尽管工业AI系统日益复杂,但在复杂时间序列数据中可靠检测细微且含噪的异常仍然是一个关键但尚未解决的挑战。在大规模工业应用中,为时间序列数据标注标签通常成本高昂且耗时,这使得无监督学习成为一种实用且广泛采用的方法。然而,现有的无监督方法经常难以区分接近正常的异常与正常模式,并且容易受到正常样本中噪声污染的干扰。为了解决这些限制,我们提出了一种新框架,利用主动学习迭代式地增强无监督模型的性能。我们框架的核心贡献包括:(1)一种掩码时间序列重构反馈策略,强制模型学习稳健的时间依赖关系;(2)一种极小极大学习策略,通过对正常和异常样本进行差异化处理来促进鲁棒性。这一过程激励模型更好地捕捉细微和含噪模式的动态特征。所提出的框架在涉及四个多变量时间序列数据集和七个无监督骨干模型的28个测试案例中进行了评估。实验结果表明,与原始模型相比,AUC提升了12.39%,证实了我们的方法可以轻松集成到现有的基于重构的无监督异常检测系统中,显著提升其性能。
查看缓存全文
缓存时间: 2026/07/02 05:39
# 检测不可检测:通过主动学习增强无监督时间序列异常检测 来源:https://arxiv.org/html/2607.00720 Hyeongwon Kanghyeongwon\_kang@korea\.ac\.kr (https://arxiv.org/html/2607.00720v1/mailto:[email protected]) Jinwoo Parkjinwoo\_park@snu\.ac\.kr (https://arxiv.org/html/2607.00720v1/mailto:[email protected]) Pilsung Kangpilsung ̇kang@snu\.ac\.kr (https://arxiv.org/html/2607.00720v1/mailto:pilsung%CB%[email protected]) LG CNS, 71 Magokjungang 8-ro, Gangseo-gu, 首尔, 大韩民国 工业与管理工程系, 高丽大学, 126-16 Anam-dong 5-ga, Seongbuk-gu, 首尔, 大韩民国 工业工程系, 首尔大学, Gwanak-ro 1, Gwanak-gu, 首尔, 大韩民国 ###### 摘要 尽管工业AI系统日益复杂,但能够在复杂时间序列数据中可靠地检测细微且嘈杂的异常仍然是一个关键但尚未解决的挑战。在大规模工业应用中,标注时间序列数据往往成本过高且耗时,这使得无监督学习成为一种实用且广泛采用的方法。然而,现有的无监督方法常常难以区分接近正常的异常与正常模式,并且容易受到正常样本中噪声污染的影响。为解决这些局限性,我们提出了一种新颖的框架,利用主动学习迭代地增强无监督模型的性能。我们框架的核心贡献是:(1) 一种掩码时间序列重建反馈策略,迫使模型学习鲁棒的时序依赖关系;(2) 一种极大极小学习策略,通过对正常和异常样本进行差异化处理来促进鲁棒性。该过程鼓励模型更好地捕捉细微和噪声模式的动态特征。所提出的框架在涉及四个多变量时间序列数据集和七个无监督骨干模型的28个测试案例上进行了评估。实验结果表明,与原始模型相比,AUC提升了12.39%,证实了我们的方法可以轻松集成到现有的基于无监督重建的异常检测系统中,显著提升其性能。 ###### 关键词: 多变量时间序列, 无监督时间序列异常检测, 主动学习 ## 1 引言 在当今日益自动化和传感器密集的工业环境中,海量的时间序列数据不断生成,捕捉机器、流程乃至整个系统的动态行为。在这股数据洪流中,即使微小的异常也可能预示着设备故障、网络攻击或金融风险等关键问题,凸显了及时准确检测的重要性。因此,旨在识别显著偏离正常行为的模式的时间序列异常检测,已成为运营可靠性和工业风险缓解的基石\[23 (https://arxiv.org/html/2607.00720#bib.bib45)\]。随着现代系统日益复杂和互联,对智能且可扩展的异常检测工具的需求比以往任何时候都更加迫切\[23 (https://arxiv.org/html/2607.00720#bib.bib45),28 (https://arxiv.org/html/2607.00720#bib.bib35)\]。这一日益增长的需求激发了大量研究活动,专注于开发有效的方法来监控和检测多变量时间序列数据中的异常\[23 (https://arxiv.org/html/2607.00720#bib.bib45),27 (https://arxiv.org/html/2607.00720#bib.bib49),19 (https://arxiv.org/html/2607.00720#bib.bib48)\]。 近年来,时间序列异常检测的研究越来越强调无监督学习方法,这主要是因为在现实应用中获取高质量标注数据面临实际挑战\[28 (https://arxiv.org/html/2607.00720#bib.bib35),4 (https://arxiv.org/html/2607.00720#bib.bib38),35 (https://arxiv.org/html/2607.00720#bib.bib37)\]。标注时间序列数据不仅劳动密集、耗时,而且需要大量的领域专业知识以及对时序依赖关系和变量间关系的细致理解\[3 (https://arxiv.org/html/2607.00720#bib.bib2),48 (https://arxiv.org/html/2607.00720#bib.bib46),9 (https://arxiv.org/html/2607.00720#bib.bib47)\]。因此,大多数研究都集中在没有标注异常的情况下对正常行为模式进行建模,将偏差识别为潜在异常\[43 (https://arxiv.org/html/2607.00720#bib.bib43),13 (https://arxiv.org/html/2607.00720#bib.bib33)\]。传统的无监督技术,包括局部异常因子 (LOF)\[7 (https://arxiv.org/html/2607.00720#bib.bib23)\]、一类支持向量机 (One-Class SVM)\[32 (https://arxiv.org/html/2607.00720#bib.bib22)\]、支持向量数据描述 (SVDD)\[37 (https://arxiv.org/html/2607.00720#bib.bib18)\] 和孤立森林 (Isolation Forest)\[21 (https://arxiv.org/html/2607.00720#bib.bib21)\],提供了轻量级的解决方案,但由于其捕获时序结构的能力有限,在处理高维或复杂的时间序列数据时往往遇到困难\[20 (https://arxiv.org/html/2607.00720#bib.bib39),36 (https://arxiv.org/html/2607.00720#bib.bib40),34 (https://arxiv.org/html/2607.00720#bib.bib41)\]。为解决这些局限性,基于深度学习的模型——如卷积神经网络 (CNN)\[18 (https://arxiv.org/html/2607.00720#bib.bib58)\]、循环神经网络 (RNN)\[31 (https://arxiv.org/html/2607.00720#bib.bib57)\] 和 Transformer\[39 (https://arxiv.org/html/2607.00720#bib.bib56)\]——因能够学习复杂的序列动态而受到关注。这一转变引发了将深度学习应用于无监督时间序列异常检测的广泛兴趣,尤其是在大规模工业环境中\[4 (https://arxiv.org/html/2607.00720#bib.bib38),34 (https://arxiv.org/html/2607.00720#bib.bib41)\]。 尽管无监督深度学习模型取得了进展,但根本性的局限性仍然存在。一个关键挑战在于其对噪声的敏感性:具有微小波动的正常数据经常被错误分类为异常,导致高误报率\[10 (https://arxiv.org/html/2607.00720#bib.bib1)\]。相反,那些与正常模式非常相似的细微异常往往被漏检,产生漏报\[8 (https://arxiv.org/html/2607.00720#bib.bib36)\]。这些局限性的核心在于,无监督模型难以区分噪声正常样本和真实异常——尤其是在具有复杂时间动态和变量间依赖关系的高维时间序列数据中\[14 (https://arxiv.org/html/2607.00720#bib.bib34),16 (https://arxiv.org/html/2607.00720#bib.bib44),47 (https://arxiv.org/html/2607.00720#bib.bib42)\]。为此,近期研究致力于提高正常模式学习的保真度,并增强对抗此类混淆因素的鲁棒性,旨在弥合实际部署中的性能差距\[4 (https://arxiv.org/html/2607.00720#bib.bib38),13 (https://arxiv.org/html/2607.00720#bib.bib33),42 (https://arxiv.org/html/2607.00720#bib.bib25)\]。这一局限性并非微不足道;它是无监督范式的根本问题,该范式缺乏语义基础。这种模糊性不可避免地导致高误报率或关键漏报,从而造成纯无监督方法无法逾越的性能天花板\[40 (https://arxiv.org/html/2607.00720#bib.bib32)\]。这需要一种混合方法,策略性地引入最少的人类专业知识。 为了克服纯无监督模型的局限性,近期研究探索了混合方法,引入有限的监督来指导异常检测。特别是,主动学习已成为一种有前景的策略,用于从无标签时间序列数据中选择性地标注最具信息量的样本,从而以最少的标注努力提升模型性能\[40 (https://arxiv.org/html/2607.00720#bib.bib32),44 (https://arxiv.org/html/2607.00720#bib.bib30),12 (https://arxiv.org/html/2607.00720#bib.bib31),5 (https://arxiv.org/html/2607.00720#bib.bib29)\]。通过将标注工作集中在最不确定或最具代表性的样本上,主动学习直接应对了无监督模型面临的挑战,尤其是在区分噪声正常模式与细微异常方面\[33 (https://arxiv.org/html/2607.00720#bib.bib28)\]。这一范式在全监督学习和无监督学习之间提供了一种实用的折衷方案,特别适合时间序列异常检测,因为在这种情况下,详尽标注几乎不可行,而纯无监督方法可能无法达到所需的准确度\[40 (https://arxiv.org/html/2607.00720#bib.bib32)\]。 尽管主动学习在增强时间序列异常检测方面显示出潜力,但其与基于深度学习的无监督重建模型的集成仍然相对未被充分探索。现有方法通常采用传统机器学习模型作为骨干\[5 (https://arxiv.org/html/2607.00720#bib.bib29)\],或在应用主动学习策略之前依赖有监督预训练\[44 (https://arxiv.org/html/2607.00720#bib.bib30),12 (https://arxiv.org/html/2607.00720#bib.bib31)\]。其中,Active-MTSAD\[40 (https://arxiv.org/html/2607.00720#bib.bib32)\] 与我们的目标最为接近,它通过主动学习将深度无监督模型与选择性监督相结合。它采用一种伪标签策略,对从无标签池中选出的查询进行标注,并通过度量学习用于训练模型。然而,这种对伪标签的依赖可能存在问题,特别是当有限的标注样本无法捕捉真实世界异常模式的多样性时。此外,Active-MTSAD 假设每一轮查询至少包含一个真实异常,这在工业环境中常常不成立,因为异常既罕见又随机。这些局限性降低了该方法的鲁棒性,并阻碍了其在大规模工业场景中的实际应用。 我们提出了一种基于主动学习的框架,旨在提升用于时间序列异常检测的无监督重建模型的性能。我们的核心创新不在于查询的选择,而在于模型如何从查询中学习。我们的方法侧重于使模型能够更好地区分噪声正常样本和细微异常。具体来说,我们引入了两个关键组成部分:(1) 一种掩码时间序列重建反馈策略,增强模型对时序依赖关系的理解;(2) 一个极大极小损失函数,分别处理正常和异常样本,以引导学习判别性时序模式。为了为此复杂的反馈机制提供信息丰富的样本,我们采用了一种有效的混合查询策略,借鉴了先前工作\[40 (https://arxiv.org/html/2607.00720#bib.bib32)\] 的原则(例如,top-k 和区间采样),以捕获具有高分数的噪声正常数据和具有较低分数的接近正常的异常。与依赖伪标签和结构修改的先前方法不同,我们的框架可以直接应用于广泛的重建型无监督模型。我们的主要贡献如下: - 1. 提取噪声和异常模式:我们设计了一种反馈机制,使用主动学习策略从无标签数据中提取噪声正常和接近正常的异常样本。这些查询由专家标注,并用于进一步训练骨干模型。一个极大极小损失函数——分别应用于正常和异常查询——增强了检测准确性。 - 2. 通过代理任务进行时序重建:为了捕获复杂的时间动态,我们在反馈策略中引入了一个掩码重建任务。通过重建输入中随机掩码的片段,模型被鼓励学习更丰富的时序表示,从而改善异常判别能力。 - 3. 模型无关框架:我们的框架与架构无关,可以无缝集成到现有的深度无监督重建模型中,无需结构修改。它在多种骨干模型上一致地提升了性能。 本文的其余部分结构如下。第2节 (https://arxiv.org/html/2607.00720#S2) 回顾了无监督时间序列异常检测的相关工作以及主动学习在时间序列分析中的应用。第3节 (https://arxiv.org/html/2607.00720#S3) 介绍了所提出的方法,详细说明了框架的每个组成部分。第4节 (https://arxiv.org/html/2607.00720#S4) 描述了实验设置和评估协议。第5节 (https://arxiv.org/html/2607.00720#S5) 报告了广泛实验和消融研究的结果。第6节 (https://arxiv.org/html/2607.00720#S6) 提供了在有和没有主动学习的情况下异常检测性能的比较分析。最后,第7节 (https://arxiv.org/html/2607.00720#S7) 总结了关键发现并展望了未来的研究方向。 ## 2 相关工作 ### 2.1 无监督多变量时间序列异常检测 无监督时间序列异常检测方法大致可分为四类:基于密度估计、基于聚类、基于预测和基于重建的方法。每一类都提供了建模正常行为并将偏差识别为异常的独特策略。 **基于密度估计的方法。** 这些方法将位于数据分布低密度区域的数据点识别为异常。例如,局部异常因子 (LOF)\[7 (https://arxiv.org/html/2607.00720#bib.bib23)\] 将一个点在其局部密度显著偏离邻居时分类为异常。DAGMM\[49 (https://arxiv.org/html/2607.00720#bib.bib17)\] 通过将高斯混合模型 (GMM) 与自编码器相结合,将这一思想进一步扩展,联合优化重建损失和密度估计。 **基于聚类的方法。** 基于聚类的方法假设正常样本形成密集的簇,而异常则远离簇的中心。Deep-SVDD\[30 (https://arxiv.org/html/2607.00720#bib.bib16)\] 是支持向量数据描述 (SVDD)\[37 (https://arxiv.org/html/2607.00720#bib.bib18)\] 的深度学习扩展,它将数据映射到潜在空间,并将正常样本包围在一个紧凑的超球体内。落在该边界之外的样本被视为异常。 **基于预测的方法。** 基于预测的技术对正常时间模式进行建模,并将具有大预测误差的实例识别为异常。这些方法根据所使用的预测骨干而有所不同。传统的统计模型如 ARIMA\[6 (https://arxiv.org/html/2607.00720#bib.bib51)\] 捕捉线性趋势,而深度学习模型如 LSTM-AD\[22 (https://arxiv.org/html/2607.00720#bib.bib20)\] 和基于 CNN 的 DeepANT\[26 (https://arxiv.org/html/2607.00720#bib.bib19)\] 则旨在从多变量序列中学习非线性时序依赖关系。 **基于重建的方法。** 这些模型旨在学习正常序列的压缩表示,能够准确地重建正常序列,但无法重建异常。LSTM-VAE\[28 (https://arxiv.org/html/2607.00720#bib.bib35)\] 利用变分自编码器对正常数据的分布进行建模,并从潜在表示中重建样本。USAD\[4 (https://arxiv.org/html/2607.00720#bib.bib38)\] 采用双自编码器结构来最小化重建误差,而 OmniAnomaly\[35 (https://arxiv.org/html/2607.00720#bib.bib37)\] 结合了堆叠循环自编码器
相似文章
桥接分类与重建:协同时间序列异常检测
本文提出CoAD,一种新颖的框架,统一了异常暴露(分类)和掩码自编码器(重建)两种范式用于时间序列异常检测,解决了它们各自的局限性。大量实验表明,CoAD在轻量快速的同时,显著优于现有最先进方法。
CALAD: 通道感知对比学习用于多变量时间序列异常检测
提出了CALAD,一个用于多变量时间序列异常检测的通道感知对比学习框架,该框架利用估计的通道相关性构建对比样本,实现了最先进的性能。
像专家一样检测时间序列异常:一种具有专用分析器的多智能体 LLM 框架
本文介绍了 SAGE,这是一种用于时间序列异常检测的多智能体 LLM 框架,它利用专用分析器来提高可解释性和可靠性。该框架在三个基准测试中表现出优于基线模型的性能,并通过结构化证据整合增强了诊断报告的质量。
TPA-AD:一种用于轴承时间序列异常检测的两阶段伪异常引导方法
TPA-AD 是一种用于轴承时间序列异常检测的两阶段伪异常引导方法,利用重建模型和对比学习在正常边界附近生成伪异常窗口,再通过 KNN 对异常进行评分——训练过程中无需真实异常样本。该方法在轴承故障和退化数据集上进行了评估,包括高速列车轴箱轴承数据。
回归修复:用于时间序列异常检测的极简去噪网络
本文提出了JuRe(Just Repair,意为“仅需修复”),一个用于时间序列异常检测的极简去噪网络。该网络在TSB-AD和UCR基准数据集上的性能匹配或超越了复杂的神经网络基线模型,表明正确的流形投影训练目标比架构复杂度更为重要。