面向复杂系统中可解释预测性维护的语义特征分割

arXiv cs.AI 2026/05/15 04:00 论文

摘要

本文提出了一种用于预测性维护的语义特征分割框架，将监测信号分解为规范成分和残差成分，以提高可解释性，同时保持预测性能。

arXiv:2605.14318v1 Announce Type: new 摘要：复杂系统中的预测性维护通常因监测变量的异质性和冗余性而变得复杂，这可能会掩盖与故障相关的信息并降低模型的可解释性。本文提出了一种语义特征分割框架，将监测特征空间分解为一个规范成分（预期保留主要预测信息）和一个残差成分（包含结构上外围的信号）。该分割通过领域专家定义的标准进行定义，并将监测变量划分为反映操作机制的功能组，如吞吐量、延迟、压力、网络活动和结构状态。为了评估这种分解的有效性，我们采用预测视角，使用预期预测风险作为任务相关信息的操作代理。通过时间感知交叉验证获得的实验结果表明，在多种时间配置下，规范空间始终比残差空间实现更低的预测风险，表明语义分割集中了最相关的故障预警信息。此外，规范片段表现出显著更强的片段内一致性而非片段间依赖性，并且这种结构组织在冗余减少后保持稳定。与完整特征空间和主成分分析（PCA）表示相比，规范空间具有相当的预测性能，并且保留了原始变量的语义含义。这些发现表明，语义特征分割提供了一种可解释且信息保持的监测信号分解方法，能够在预测性维护应用中实现具有竞争力的预测性能，同时不牺牲操作可解释性。

查看原文

查看缓存全文

缓存时间: 2026/05/15 06:23

# 面向复杂系统可解释预测性维护的语义特征分割 来源：https://arxiv.org/html/2605.14318 ###### 摘要 复杂系统中的预测性维护常因监控变量的异质性和冗余性而变得复杂，这可能会掩盖与故障相关的信息并降低模型的可解释性。本文提出了一种语义特征分割框架，将监控特征空间分解为一个预期保留主要预测信息的典型成分和一个包含结构外围信号的残差成分。该分割通过领域知识标准定义，并将监控变量按功能分组，反映吞吐量、延迟、压力、网络活动和结构状态等运行机制。为了评估这种分解的有效性，我们采用预测视角，以预期预测风险作为任务相关信息的一种操作性代理。通过时间感知交叉验证获得的实验结果表明，在多个时间配置下，典型空间始终比残差空间实现更低的预测风险，表明语义分割集中了与故障预测最相关的信息。此外，典型段内的内部一致性显著强于段间依赖，并且这种结构组织在降冗余后仍保持稳定。与完整特征空间及主成分分析（PCA）表示相比，典型空间具有可比的预测性能，同时保留了原始变量的语义含义。这些发现表明，语义特征分割提供了一种可解释且信息保持的监控信号分解方式，在不牺牲预测性维护应用所需的操作可解释性的前提下，实现了具有竞争力的预测性能。 ###### 关键词：预测性维护，语义特征分割，特征空间分解，分布式系统监控，故障预测，不平衡数据，时间感知交叉验证，复杂系统 ††期刊：Neural Computing and Applications \\ affalition organization=INAF，Osservatorio Astrofisico di Catania，addressline=Via S. Sofia 78，city=Catania，postcode=95123，country=Italy ## 1 引言 近年来，工业系统中高频监控数据的日益丰富显著扩展了预测性维护（PdM）策略的潜力。现代基础设施，从分布式计算系统到复杂的机电平台，配备了众多异构传感器和软件级指标，产生捕捉系统行为多个方面的高维时间序列（Shi and Zhang (2023 (https://arxiv.org/html/2605.14318#bib.bib1))）。虽然这种数据丰富性为早期故障检测提供了机会，但也带来了与特征异质性、冗余性以及可能掩盖故障动态相关信号的背景噪声相关的重大挑战（Ndaoet al. (2026 (https://arxiv.org/html/2605.14318#bib.bib2))）。各种数据驱动型PdM方法中的一个常见假设是，通过利用尽可能多的信息（例如，直接使用所有可用特征或通过自动特征提取技术，如降维和表示学习）可以提高预测性能（Lianget al. (2025 (https://arxiv.org/html/2605.14318#bib.bib3))）。然而，在以异构子系统和部分重叠动态为特征的复杂系统中，并非所有特征都对预测任务有同等贡献。特别是，很大一部分观测变量可能编码了背景过程、冗余信息或与故障预测无直接关联的弱相关信号。在我们的特定场景中——一个通过多个JVM和系统级指标监控的容器化Cassandra数据库环境——许多特征根据不同的运行机制演变（累积计数器、延迟百分位数、连接状态和内存压力），不加区分地使用这些特征可能会掩盖真正指示故障的信号。不加区分地使用这些特征可能会导致模型复杂度增加、可解释性降低，有时还会导致预测性能下降（Jachymczyket al. (2024 (https://arxiv.org/html/2605.14318#bib.bib4))）。在此背景下，识别和隔离任务相关信息成为了一个核心问题。经典方法通过特征选择或降维方法来解决此问题，旨在保留信息量最大的数据成分。尽管这些技术在各种设置中有效，但它们通常由统计标准驱动，并且常常缺乏与基础系统结构的清晰联系（Rossiet al. (2025 (https://arxiv.org/html/2605.14318#bib.bib5))）。因此，所选特征可能难以解释，并且可能无法反映系统有意义的功能组件。在本研究中，我们提出了一种基于语义特征分割的替代视角，其中特征空间被划分为两个互补的子空间：一个旨在捕捉对故障事件具有高预测能力的变量的典型空间，以及一个包含其余特征的残差空间。与纯统计选择方法不同，这种分割是手动设计的，植根于领域专业知识，反映了系统监控指标的功能分类，例如累计吞吐量、延迟、压力、网络状态和结构指标，每个都与特定的运行机制相关。这种专家驱动的划分确保了分割不仅仅是统计性的，而且是系统架构中的语义锚定，保留了可解释性和物理意义。本研究的核心假设是，这种分割促使系统相对于预测任务的功能性分解。更具体地说，我们假设典型空间集中了大部分任务相关信息，而残差空间贡献极小或冗余。为了探究这一假设，我们采用了一个预测框架，其中通过时间感知交叉验证和对数损失估计的预期风险被用作性能的操作性衡量指标，并间接用作信息相关性的衡量指标。分析沿着两个互补方向进行。首先，我们比较了分别在典型空间和残差空间上训练的模型的预测性能，表明典型表示系统地实现了更低的风险，从而支持其在故障预测中的主导作用。其次，我们检验了两个空间之间的交互作用，表明残差空间既不能预测故障，也不能在典型模型识别的高风险状态下提供一致的条件增强。这些结果通过与完整特征空间及基于主成分分析（PCA）的标准降维基线比较得到进一步探究，使我们能够评估所提出的分割是否比传统特征工程方法具有优势。因此，本研究的贡献是双重的。从方法论角度来看，我们引入了一个基于语义分割和预测风险分析来评估复杂系统中特征相关性的结构化框架。从解释性角度来看，我们提供了实证证据，支持特征空间的分层组织，其中信息丰富的核心可以与广泛无信息的背景区分开来。这种双重贡献在PdM设置中尤为重要，因为预测性能和可解释性在支持操作决策中都起着关键作用（Hakami (2024 (https://arxiv.org/html/2605.14318#bib.bib6))）。总体而言，所提出的方法提供了一种在高维工业监控场景中降低复杂性、提高可解释性并保持预测有效性的清晰途径，有助于更结构化地理解复杂系统中的信息流。 ## 2 问题形式化 在介绍正式数学框架之前，我们简要介绍期望达到的分解所需属性。**段可分性**要求属于同一语义段的特征比属于不同段的特征具有更强的内部一致性。**降冗余下段可分性的鲁棒性**要求在从典型空间中移除高度共线性或冗余特征后，可分性条件仍然存在。**系统的功能分解**指出语义分割相对于预测任务诱导了系统的分解，其中典型空间比残差空间捕捉更多的任务相关信息。第四个属性，**典型空间主导性与残差空间边际性**，具体说明残差空间既没有显著的预测能力，也不能在典型模型识别的高风险状态下提供一致的条件增强。这四个属性为本章剩余部分引入的数学形式化提供了概念基础。 ### 2.1 段可分性 设 F\_1=\{f\_11, f\_12, ..., f\_1n\}, F\_2=\{f\_21, f\_22, ..., f\_2n\}, ..., F\_m=\{f\_m1, f\_m2, ..., f\_mn\} 为特征 f\_1, f\_2, ..., f\_n 在时间范围 t=1,2,...,m 上的值的集合。沿时间轴的值集合可写为： F = ⋃\_\{i=1\}^\{m\} F\_i = ⋃\_\{\begin{subarray}{c}j=1 \\ k=1\end{subarray}\}^\{\begin{subarray}{c}j=m \\ k=n\end{subarray}\} f\_\{jk\} 用 F\_C 表示应包含复杂系统强信号的特征集合，用 F\_R 表示其余特征的集合，则有 F\_C ∪ F\_R = F，F\_C ∩ F\_R = ∅。F\_C 被称为“典型”集合，而 F\_R 代表“残差”特征集合。此时，我们可以将 F\_C 集合划分为若干语义相关的段 (S) (Xu et al. (2024 (https://arxiv.org/html/2605.14318#bib.bib7)))，即一般段 S\_k 定义为 S\_k = \{(f\_i, ..., f\_j) | sim(f\_a, f\_b)=1 ∀ f\_a, f\_b ∈ S\_k)\}，其中 sim(f\_a, f\_b) = \begin{cases} 1, & f\_a 和 f\_b 语义相关 \\ 0, & f\_a 和 f\_b 不语义相关 \end{cases} 如引言所述，在本研究阶段，语义相关性根据领域专家知识手动定义。根据定义，我们得到 F\_C = ⋃\_\{i=1\}^\{p\} S\_i，且若 i≠j，则 S\_i ∩ S\_j = ∅。考虑属于 F\_C 的任意两个特征，令 ρ\_sp(f\_i, f\_j) 表示 f\_i 和 f\_j 之间的斯皮尔曼相关系数 (Spearman (1904 (https://arxiv.org/html/2605.14318#bib.bib8)))。所有段内相关性的分布由属于**同一段**的所有特征对定义： Ω\_k^in = \{ρ\_sp(f\_i, f\_j) : f\_i, f\_j ∈ S\_k, i≠j\} S\_k 中所有特征之间的平均相关性由典型内相关性度量表示，并通过以下公式计算： ICC\_k = \frac{2}{n\_k(n\_k-1)} \sum\_\{f\_i, f\_j ∈ S\_k\} ρ\_sp(f\_i, f\_j) 其中 n\_k 表示第 k 段中的特征数。项 ICC\_macro = \frac{1}{p} \sum\_\{i=1\}^\{p\} ICC\_i 表示所有段平均 ICC 的平均值。令 Ω^in = ⋃\_\{k=1\}^\{p\} Ω\_k^in 表示 F\_C 中所有相关性分布的集合，项 ICC\_micro = \frac{1}{|\Omega^in|} \sum\_\{k=1\}^\{p\} ICC\_k 表示合并的所有段内相关性的平均值。考虑任意两个段 S\_a, S\_b ∈ F\_C 且 a≠b。我们用 Ω\_ab^out = \{ρ\_sp(f\_i, f\_j) | f\_i ∈ S\_a, f\_j ∈ S\_b, i≠j\} 表示**不同段**之间所有相关性的集合。任意两个段 S\_a, S\_b ∈ F\_C 且 a≠b 之间的平均段间相关性由下式给出： ICOR\_ab = \frac{1}{n\_a n\_b} \sum\_\{f\_i ∈ S\_a\} \sum\_\{f\_j ∈ S\_b\} ρ\_sp(f\_i, f\_j) 与 ICC 类似，ICOR 也有两种计算方式： ICOR\_macro = \frac{1}{\binom{p}{2}} \sum\_\{a<b\} ICOR\_ab 和 ICOR\_micro = \frac{1}{|\Omega^out|} \sum\_\{a<b\} \sum\_\{ρ ∈ Ω\_ab^out\} ρ 其中 Ω^out = ⋃\_\{a<b\} Ω\_ab^out 为所有段间相关性集合。在此背景下，我们提出以下零假设 H\_0: ICC ≤ ICOR 和备择假设 H\_1: ICC > ICOR。即，属于同一语义段的特征展现出比不同段之间关系更显著的内部一致性，证明语义段确实是分离且一致的，捕捉了系统的不同子系统。 ### 2.2 降冗余下段可分性的鲁棒性 在前一节中，我们将典型空间 F\_C 定义为一个有限集合，结构化为语义段集合 \{S\_k=1^p\}，使得每个段代表系统特定维度（延迟、状态、压力等）下的一个一致特征子族。形式上，这些段构成了典型特征空间的一个划分：⋃\_\{i=1\}^\{p\} S\_i = F\_C。基于此结构，我们利用从特征间相关性导出的两个功能算子引入了可分性概念：典型内相关性（ICC）评估段内一致性，以及典型间相关性（ICOR）量化不同段之间的依赖性。相关（段内一致性）与冗余（跨段重复）之间的区别是特征选择理论的核心，其中特征间的高相关性可能表示有意义的共享动态，也可能表示多余的重复 (Sun et al. (2024 (https://arxiv.org/html/2605.14318#bib.bib11)))。现在引入降冗余算子 P: F\_C → \tilde{F}\_C，其中 \tilde{F}\_C ⊆ F\_C 表示经过**剪枝**任务后的特征空间。此算子可被视为一种选择性投影，消除冗余或高度共线性的变量，并保留相对于段内相关性阈值仍具信息性的变量。基于相关性分析去除冗余特征是

面向复杂系统中可解释预测性维护的语义特征分割

相似文章

用于发动机健康管理与剩余使用寿命预测的科学机器学习

从像素到概念：分割模型真的理解它们分割的内容吗？

基于表格基础模型的统一且数据高效的预测与健康管理

用于医学图像分割的质量引导半监督学习

基于实例分割的像素级路面病害评估

提交意见反馈