TPA-AD:一种用于轴承时间序列异常检测的两阶段伪异常引导方法

arXiv cs.LG 论文

摘要

TPA-AD 是一种用于轴承时间序列异常检测的两阶段伪异常引导方法,利用重建模型和对比学习在正常边界附近生成伪异常窗口,再通过 KNN 对异常进行评分——训练过程中无需真实异常样本。该方法在轴承故障和退化数据集上进行了评估,包括高速列车轴箱轴承数据。

arXiv:2606.04073v1 Announce Type: new Abstract: 本文针对仅有正常样本可用于训练的设定,提出了一种用于轴箱轴承时间序列异常检测(time series anomaly detection, TSAD)的两阶段伪异常引导异常检测方法(\textbf{T}wo-stage \textbf{P}seudo \textbf{A}nomaly-guided \textbf{A}nomaly \textbf{D}etection, \textbf{TPA-AD})。该方法首先利用重建模型和逐特征目标误差控制,在正常边界附近生成伪异常窗口;然后通过正常窗口与伪异常窗口之间的对比学习,习得对异常敏感的表征;最后利用 k 近邻(KNN)算法生成窗口级和点级异常分数。与现有依赖已知故障类别、真实异常先验或随机异常注入的方法相比,TPA-AD 通过在边界邻域内构造伪异常来提升正常边界的可分性,并能在混合变量场景下联合处理连续特征和离散特征。主要实验在轴承故障检测数据集和退化过程数据集上进行,并额外在 $13$ 个公开 TSAD 数据集上进行了探索性扩展实验。结果表明,所提方法能产生较为稳定的异常响应,对退化演化过程敏感,并在公开 TSAD 基准数据集及真实高速列车相关轴承数据上展现出一定程度的广泛适用性。
查看原文
查看缓存全文

缓存时间: 2026/06/05 02:20

# TPA-AD:一种用于轴箱轴承时间序列异常检测的两阶段伪异常引导方法

来源:https://arxiv.org/html/2606.04073

###### 摘要

本文提出了一种两阶段伪异常引导异常检测方法(Two-stage Pseudo Anomaly-guided Anomaly Detection,TPA-AD),用于在仅有正常样本可用于训练的设置下对轴箱轴承时间序列进行异常检测(time series anomaly detection,TSAD)。该方法首先利用重建模型和逐特征目标误差控制在正常边界附近生成伪异常窗口,然后通过正常窗口与伪异常窗口之间的对比学习来习得对异常敏感的表示,最后使用 k 近邻(KNN)生成窗口级和点级异常分数。与依赖已知故障类别、真实异常先验或随机异常注入的现有方法相比,TPA-AD 通过在边界邻域构造伪异常来提升正常边界的可分性,并能在混合变量场景中联合处理连续特征和离散特征。主要实验在轴承故障检测数据集和退化过程数据集上进行,并在 13 个公开 TSAD 数据集上进行了额外的探索性扩展。结果表明,所提方法能产生相对稳定的异常响应,对退化演变敏感,并在公开 TSAD 基准测试和真实高铁相关轴承数据上展现出一定程度的广泛适用性。

###### 关键词:故障检测,轴承故障检测,高铁故障检测,TSAD,对比学习

††期刊:Journal of Industrial Information Integration

\\affiliation \[1\] 哈尔滨工业大学(威海)海洋工程学院,山东省威海市文化西路,邮编:264209

\\affiliation \[2\] 中车青岛四方机车车辆股份有限公司转向架开发部技术中心,山东省青岛市金宏东路,邮编:266111

\\affiliation \[3\] 青岛大学,山东省青岛市宁夏路308号,邮编:266071

\{highlights\}

我们提出了一种面向仅有正常样本训练场景的两阶段伪异常引导框架,将重建驱动的伪异常生成与对比表示学习相结合,无需依赖真实异常样本即可提升轴箱轴承异常的可分性。

我们设计了逐特征目标误差控制和伪异常过滤机制,用于生成偏差幅度可控、在连续特征子空间中分布更连续的边界样本,从而缓解传统异常注入中注入异常分散、边界不稳定的问题。

我们构建了涵盖故障检测、退化检测以及公开 TSAD 数据集扩展的实验体系,在多工况轴承数据和长时退化序列上对所提方法进行了系统评估,同时分析了其在通用时间序列异常检测任务上的广泛适用性。

## 1 引言

高速列车轴箱轴承是转向架系统中的关键旋转部件,其服役状态直接影响运营安全、乘坐舒适性和维护成本。在长期运行过程中,轴箱轴承受到高速旋转、轮轨激励、载荷变化、轨道不平顺和环境噪声的综合作用。在上述条件下,局部损伤、磨损和润滑退化等异常状态可能逐渐积累,最终演变为严重故障。振动信号能够灵敏地反映轴承内部的冲击、调制和非平稳动态特性。因此,基于轴箱加速度计采集的振动信号进行状态监测和异常检测具有重要的实际意义。

近年来,滚动轴承故障诊断已逐渐从手工特征提取转向深度表示学习。相关综述表明,卷积神经网络、注意力机制、图神经网络和基于 Transformer 的模型已成为智能轴承诊断的重要工具Zhao et al.(2025 (https://arxiv.org/html/2606.04073#bib.bib1))。在复杂工况下,已有研究分别从变速与样本不平衡Dong et al.(2024a (https://arxiv.org/html/2606.04073#bib.bib2))、基于伪标签的时频监督对比学习与无监督域自适应Pang et al.(2024 (https://arxiv.org/html/2606.04073#bib.bib3))以及动态模型辅助解耦Xu et al.(2025 (https://arxiv.org/html/2606.04073#bib.bib4))等角度提升了模型鲁棒性。在模型设计方面,带交叉融合 Transformer 的卷积Lin et al.(2023 (https://arxiv.org/html/2606.04073#bib.bib5))、GAF 结合 CNN-ViTZhou et al.(2024a (https://arxiv.org/html/2606.04073#bib.bib6))以及小样本学习框架Li et al.(2024 (https://arxiv.org/html/2606.04073#bib.bib7))等方法被用于增强振动信号特征表示。在多传感器和工业场景中,多传感器频域融合Dai et al.(2025 (https://arxiv.org/html/2606.04073#bib.bib8))、VMD 结合轻量网络Wang and Feng(2024 (https://arxiv.org/html/2606.04073#bib.bib9))、轻量对比 TransformerDong et al.(2024b (https://arxiv.org/html/2606.04073#bib.bib10))以及多源残差卷积融合网络Ye et al.(2025 (https://arxiv.org/html/2606.04073#bib.bib11))等方法进一步解决了噪声、有限样本和多源信息融合问题。针对高速列车转向架轴承,AGFCN 等方法考虑了强噪声和变载荷复杂工况下的诊断问题He et al.(2025 (https://arxiv.org/html/2606.04073#bib.bib12))。此外,零样本诊断Li et al.(2025 (https://arxiv.org/html/2606.04073#bib.bib13))、频率模式图建模Liu et al.(2025a (https://arxiv.org/html/2606.04073#bib.bib14))以及跨域缺失数据设置下的复数域补全与无监督时频对齐Wang et al.(2025 (https://arxiv.org/html/2606.04073#bib.bib15))等工作均表明,真实轴承监测场景中往往同时存在标签不足、跨工况偏移、异常样本稀缺和多源噪声干扰等问题。

Refer to caption

图1:传统故障注入与本文提出的伪异常生成机制的示意对比。前者通常产生分散的负样本,因而难以在正常流形外形成稳定边界。后者在重建误差空间中以多个强度级别生成伪异常样本,从而在正常区域周围形成更连续的异常边界带。

然而,现有大多数轴承故障诊断研究针对已知故障类别的识别,通常依赖故障样本、类别标签或源域故障知识。在真实的高铁维护场景中,严重故障样本稀缺,异常标签难以获取,且许多异常不属于预定义的故障类别。因此,将轴箱振动监测建模为时间序列异常检测(TSAD)问题更符合实际应用需求。近年来,深度 TSAD 方法已形成相对完整的研究格局,涵盖基于预测、基于重建、生成式以及表示学习等范式Zamanzadeh Darban et al.(2024 (https://arxiv.org/html/2606.04073#bib.bib16))。与此同时,异常检测基准测试、评估指标和实验协议的可靠性也受到越来越多的关注Liu and Paparrizos(2024 (https://arxiv.org/html/2606.04073#bib.bib17));Qiu et al.(2025 (https://arxiv.org/html/2606.04073#bib.bib18))。在具体方法方面,频域多模式正常性学习Chen et al.(2024 (https://arxiv.org/html/2606.04073#bib.bib19))、时域-频域-残差域联合自监督建模Sun et al.(2024 (https://arxiv.org/html/2606.04073#bib.bib20))以及时频掩码自编码器Fang et al.(2024 (https://arxiv.org/html/2606.04073#bib.bib21))均强调了频率结构和多域表示对异常检测的重要性。ImDiffusion 将插补机制与扩散模型相结合用于多变量 TSADChen et al.(2023 (https://arxiv.org/html/2606.04073#bib.bib22)),而 METER 通过动态概念自适应解决在线异常检测中的概念漂移问题Zhu et al.(2023 (https://arxiv.org/html/2606.04073#bib.bib23))。对于多变量时间序列,图对齐方法被用于刻画通道依赖关系的变化Wang et al.(2024 (https://arxiv.org/html/2606.04073#bib.bib24)),CATCH 通过频域分块和通道融合模块捕获细粒度频率特征和通道相关性Wu et al.(2025 (https://arxiv.org/html/2606.04073#bib.bib25))。此外,DADAShentu et al.(2025 (https://arxiv.org/html/2606.04073#bib.bib26))、混合原型学习Shen(2025 (https://arxiv.org/html/2606.04073#bib.bib27))、CARLA 自监督对比表示学习Darban et al.(2025 (https://arxiv.org/html/2606.04073#bib.bib28))、KAN-ADZhou et al.(2024b (https://arxiv.org/html/2606.04073#bib.bib29))以及基于重建趋势的 RTDetectorLiu et al.(2025b (https://arxiv.org/html/2606.04073#bib.bib30))等近期方法,分别从通用异常检测、原型约束、对比学习和抑制重建过拟合等角度进一步推动了 TSAD 的发展。

尽管上述方法在通用异常检测和机械故障诊断中已取得良好效果,但在仅有正常训练样本的轴箱轴承监测场景中仍存在两个关键局限。第一,许多方法隐式地依赖真实异常、异常注入先验或相对稳定的故障模板。第二,即便引入了人工负样本,这些样本往往较为分散,难以在正常流形外形成连续且稳定的判别边界。因此,如何在不依赖真实异常样本的情况下构造具有真实边界意义的"近异常"参考样本,是提升轴箱轴承 TSAD 判别能力的关键问题。

如图1 (https://arxiv.org/html/2606.04073#S1.F1)所示,传统故障注入通常具有较强的任务专一性,所生成的样本往往与几种已知故障模式相似。当测试阶段出现未见过的异常或退化早期的弱异常时,此类模型可能无法维持稳定的判别能力。相比之下,本文并不直接构造特定的故障形态,而是基于正常样本在多个逐特征误差区间内的重建行为,生成偏差幅度可控的伪异常窗口。所得伪异常样本更集中于正常流形外边界的邻域,从而为后续对比表示学习提供连续且稳定的负样本参考。

为更清晰地定位本文与现有轴承故障诊断和时间序列异常检测研究的关系,表1 (https://arxiv.org/html/2606.04073#S1.T1)和表2 (https://arxiv.org/html/2606.04073#S1.T2)总结了与本文最相关的两组代表性研究。

表1:轴承故障诊断关键参考文献

| 参考文献 | 场景/问题 | 方法 | 与本文的关联 |
|---|---|---|---|
| Dong et al. Dong et al.(2024a (https://arxiv.org/html/2606.04073#bib.bib2)) | 变速与样本不平衡 | 多尺度动态监督对比学习,增强不同状态表示间的判别性。 | 支持对比学习在复杂工况下轴承诊断中的有效性。 |
| Pang et al. Pang et al.(2024 (https://arxiv.org/html/2606.04073#bib.bib3)) | 变速下的无监督域自适应 | 结合伪标签与时频监督对比学习,缓解跨工况分布偏移。 | 与本文利用伪异常/伪标签信息进行表示学习的思路相关。 |
| He et al. He et al.(2025 (https://arxiv.org/html/2606.04073#bib.bib12)) | 高铁转向架轴承复杂工况 | 强噪声和变载荷下高铁转向架轴承故障诊断。 | 与本文应用场景最为接近,支持轴箱轴承振动监测的背景。 |
| Li et al. Li et al.(2025 (https://arxiv.org/html/2606.04073#bib.bib13)) | 零样本轴承诊断 | 在缺乏故障样本的情况下利用故障频谱知识和自驱动对比学习。 | 支持真实故障样本稀缺时利用弱先验或伪信息的必要性。 |
| Wang et al. Wang et al.(2025 (https://arxiv.org/html/2606.04073#bib.bib15)) | 跨域缺失数据诊断 | 通过复数域补全和无监督时频对齐解决跨域和缺失数据问题。 | 支持真实工业数据中处理分布偏移、缺失和无监督对齐的需求。 |

表2:时间序列异常检测关键参考文献

| 参考文献 | 场景/问题 | 方法 | 与本文的关联 |
|---|---|---|---|
| Zamanzadeh Darban et al. Zamanzadeh Darban et al.(2024 (https://arxiv.org/html/2606.04073#bib.bib16)) | 深度 TSAD 综述 | 系统总结基于预测、重建、生成式和表示学习的方法。 | 提供整体 TSAD 研究背景和问题定义。 |
| Liu and Paparrizos Liu and Paparrizos(2024 (https://arxiv.org/html/2606.04073#bib.bib17)) | TSAD 基准测试与评估 | 分析数据集、指标和评估协议对结果可靠性的影响。 | 支持本文点级评分和精细指标设计的必要性。 |
| Chen et al. Chen et al.(2024 (https://arxiv.org/html/2606.04073#bib.bib19)) | 多模式正常性学习 | 在频域学习多种正常模式,提升复杂系统中的异常检测效率。 | 与轴箱振动信号中的多正常工作模式和频率结构相关。 |
| Wu et al. Wu et al.(2025 (https://arxiv.org/html/2606.04073#bib.bib25)) | 多变量频域与通道关系 | 利用频域分块和通道融合模块捕获频率特征和通道相关性。 | 支持多通道振动信号中频域和通道信息的重要性。 |
| Darban et al. Darban et al.(2025 (https://arxiv.org/html/2606.04073#bib.bib28)) | 自监督对比 TSAD | 通过异常注入和对比学习获得判别性时间序列表示。 | 与本文利用伪异常负样本在嵌入空间中构造边界的思路相关。 |

综上所述,本文建立了一个以"伪异常构造–对比表示学习"为核心的高速列车轴箱轴承监测 TSAD 框架。

相似文章

桥接分类与重建:协同时间序列异常检测

arXiv cs.LG

本文提出CoAD,一种新颖的框架,统一了异常暴露(分类)和掩码自编码器(重建)两种范式用于时间序列异常检测,解决了它们各自的局限性。大量实验表明,CoAD在轻量快速的同时,显著优于现有最先进方法。

用于ESA卫星遥测异常检测的层次化集成管道

arXiv cs.LG

这篇学术论文提出了一种用于ESA卫星遥测异常检测的层次化集成管道,利用基于形状序列(shapelet)和统计的特征提取技术,来识别多元时间序列数据中的细微异常。

用于离策略时序差分预测的行为感知辅助修正

arXiv cs.AI

本文提出用于离策略时序差分预测的行为感知辅助修正,引入了BA-TDC和BA-TDRC算法,这些算法用行为贝尔曼矩阵替代辅助协方差矩阵,以提高稳定性和收敛性。理论分析和在标准基准上的实验验证了所提方法的有效性。