多变量时间序列无训练时滞谱嵌入的平稳性与耦合判据

arXiv cs.LG 2026/06/15 04:00 论文

time-series spectral-embeddings training-free multivariate stationarity coupling representation-learning

摘要

本文提出了一种可证伪的适用性判据，用于基于时滞谱嵌入的多变量时间序列的无训练固定长度描述符，展示了该描述符在何种情况下有望有效，并在多个基准上进行了验证。

arXiv:2606.13823v1 公告类型：新摘要：我们研究多变量时间序列的无训练固定长度描述符，并提出问题：不仅在于这种描述符是否表现良好，更在于它何时有望有效。我们的研究对象是 $D(\tau)$，它由时滞相关矩阵经过Marchenko-Pastur截断构建，仅保留携带信号的奇异值，并通过与类别质心的余弦相似度进行分类，且无需学习参数。本文的核心贡献并非该描述符本身，而是针对其可证伪的适用性判据。基于平稳高斯VAR(1)模型，我们论证当信号近似平稳且类别信息存在于跨通道时间耦合而非边际每通道功率时，$D(\tau)$ 能够区分两类。我们半正式地推导出三个推论：可区分性条件、为什么静态（$\tau=0$）协方差退化为随机猜测，以及为什么一个平稳但功率判别型的范式会击败该描述符。该判据是可操作的：一个两部分预检测试——增广Dickey-Fuller平稳性检验和功率基线饱和检验——在训练前即可预测适用性。我们在混合数据集上验证了这两部分。在四个符合判据的范式（Sleep-EDF、BCI-IV-2a、MIT-BIH、ESC-50）中，该描述符仅以极低的成本即可与强基线媲美，在Sleep-EDF上基于20个受试者的留一法（单CPU线程）达到 $88.5\pm4.5\%$ 的性能。而在三个违背判据的范式中——非平稳ERP、以及功率判别型的金融波动性与可穿戴压力场景——描述符恰好如预检所预测的那样失败，这些负面结果反而更具信息价值。我们明确指出 $D(\tau)$ 并非最精确的表征；其价值在于一种紧凑、无训练的嵌入，且其有效域是事先已知的。

查看原文

查看缓存全文

缓存时间: 2026/06/15 09:08

# 基于平稳性与耦合准则的无训练时滞谱嵌入多元时间序列描述子 来源：https://arxiv.org/html/2606.13823

###### 摘要

本文研究多元时间序列的**无训练**固定长度描述子，并提出一个表征学习文献通常隐含的问题：不仅在于某个描述子在基准测试中表现如何，更在于**何时**可以预期它有效。我们的研究对象是 \(D(\tau)\)，该描述子基于时滞相关矩阵构建，由本团队的一名成员在随机矩阵监测网络流量中开发 [1 (https://arxiv.org/html/2606.13823#bib.bib1),2 (https://arxiv.org/html/2606.13823#bib.bib2),3 (https://arxiv.org/html/2606.13823#bib.bib3)]，并截断至 Marchenko–Pastur (MP) 边界，仅保留承载信号的奇异值，再通过余弦相似度与类别质心进行比较，无需任何学习参数。本文的核心贡献并非描述子本身，而是一个**可证伪的适用性准则**。基于平稳高斯 VAR(1) 生成模型，我们认为 \(D(\tau)\) 在以下条件下能够区分两个类别：信号近似平稳，且类别信息存在于其跨通道**时间耦合**中，而非边缘的逐通道功率中。我们半形式化地推导出该模型的三个推论：嵌入空间中两个类别可区分的条件；静态（\(\tau=0\)）协方差为何会退化至随机水平；以及即使每个样本都处理良好，一个平稳但以功率区分的范式为何会击败该描述子。该准则可操作性强：包含一个两部分预检测试——增强 Dickey–Fuller 平稳性检验与功率基线饱和度检验——可在任何训练前预测适用性，我们将其总结为一条决策规则。我们在刻意混合的数据集上验证了该准则的两个边界。在满足准则的四个范式上——Sleep-EDF 睡眠分期、BCI-IV-2a 运动想象、MIT-BIH 心律失常和 ESC-50 环境声音——该描述子在极低的成本下与强基线方法竞争，在 Sleep-EDF 上采用 20 名受试者留一法，仅用单 CPU 线程（无 GPU）约十三分钟即达到 \(88.5 \pm 4.5\%\)。在违反准则的三个范式上——非平稳的瞬态响应 ERP，以及两个功率区分的任务（金融波动率制度和可穿戴压力检测）——该描述子未能通过准则，在非平稳案例中退化至随机水平，在功率区分案例中被简单的功率基线方法超越，这与预检测试的预期完全一致；这些负面结果才是本文更具信息量的部分。我们全程明确：\(D(\tau)\) 并非现有最准确的表示；其价值在于一个紧凑、无训练的嵌入，且其有效域可预先获知。

## 1 引言

多元时间序列，无论其来自何种传感器，其动态特性体现在通道随时间协变的方式上。相机、头皮电极阵列、麦克风和胸导联都会返回相同的数学对象：一个实数矩阵，行索引时间，列索引通道；区分不同状态的区别性内容就写在该矩阵的二阶时间耦合结构中。然而，领域内用于处理此类数据的大多数方法在构造上都是特定于模态的：视频模型假设空间网格，睡眠分期器假设脑电图，声学模型假设语谱图前端。每种方法在其轨迹内表现优异，但在轨迹外则失效。我们感兴趣的是相反的设计点：一个单一描述子，对每种模态以相同方式计算，不携带任何学习参数，并将任意加窗的多元信号简化为一个固定长度的向量，可通过余弦相似度进行比较。

无训练描述子的吸引力恰恰在深度学习配方最难应用的场景中最为突出。许多部署场景需要比较或分类多元信号，但标记训练数据极少甚至没有，且无 GPU：如设备端分诊、睡眠阶段或嗜睡监测、面向新受试者的脑机接口校准，或工况变化下的机器健康监测。深度学习模型在孤立场景中占据排行榜主导地位，但它们假设有标记的域内语料库、加速器硬件和训练循环，而这些假设在上述场景中共同失效。因此，一个不需要任何这些条件的描述子既可作为一个强零训练基线，也充当一个特征提取器，可在其上附加一个小型的校准头。

我们可以根据暴露的谱和选择秩截断的方式，对现有的用于序列数据的无训练描述子进行分类。第一类拟合一个显式生成模型并读出其参数：Doretto 等人 [11 (https://arxiv.org/html/2606.13823#bib.bib11)] 的动态纹理线性动态系统从一个帧堆叠奇异值分解回归出状态转移矩阵，并将其特征值作为描述子。第二类应用一个固定的解析算子：Gu 等人 [12 (https://arxiv.org/html/2606.13823#bib.bib12)] 的 HiPPO 多项式投影算子将近期历史压缩进一个系数向量，该向量对给定的投影基是最优的，其傅里叶变体相当于滑动离散傅里叶变换。第三类是随机矩阵意义上的谱方法，对样本协方差的本征分量进行排序，并使用 Marchenko–Pastur 定律来决定哪些是信号：属于这一类的有 Veraart 等人 [9 (https://arxiv.org/html/2606.13823#bib.bib9)] 的 patch-Casorati 去噪器 MPPCA，以及本团队一名成员为监测域间网络流量开发的时滞相关矩阵 [1 (https://arxiv.org/html/2606.13823#bib.bib1),2 (https://arxiv.org/html/2606.13823#bib.bib2),3 (https://arxiv.org/html/2606.13823#bib.bib3)]。第三类很吸引人，因为不同于方差排名方法（如 PCA 或 ICA）简单地假设高方差方向承载动态，它利用随机矩阵理论的严格工具来识别噪声并确立其谱边界，然后仅保留那些证明超过该边界的特征值。

我们从早期网络监测工作中提取时滞相关矩阵 \(D(\tau)\)，并通过与 Marchenko–Pastur 边缘 [4 (https://arxiv.org/html/2606.13823#bib.bib4),5 (https://arxiv.org/html/2606.13823#bib.bib5)] 作为噪声截断相结合，将其转变为通用描述子。我们的核心主张并非该描述子是多元时间序列最准确的表示——事实并非如此——而是与大多数表示不同，它附带一个精确且可证伪的关于**何时**它是正确工具的说明。我们提出四点主张。首先且最重要的是，我们给出一个**适用性准则**：基于平稳高斯 VAR(1) 生成模型，我们证明 \(D(\tau)\) 恰好能在以下条件下区分两个类别：信号近似平稳，且类别信息存在于跨通道时间耦合中，而非边缘的逐通道功率中；我们将该准则操作化为一个两部分预检测试，可在任何训练前进行检查。其次，我们在满足准则的四个范式上确认了正半部分——睡眠分期、运动想象、心律失常和环境声音——在这些任务上，描述子匹配或击败了通道功率基线，彻底击败了简单的基线，并达到与强多频带基线相当的水平，并且以极低的计算成本与强大的学习方法竞争。第三，也是最具信息量的一点，我们在违反准则的三个范式上确认了负半部分——瞬态响应事件相关电位（非平稳），以及两个平稳但功率区分的任务（金融波动率制度和可穿戴压力检测）——在每个任务上，描述子如预检测试预测的那样失效；值得注意的是，该准则将生理失败（压力）与生理成功区分开来。第四，该描述子紧凑、无训练且具有噪声不变性，在单个 CPU 核心上每窗口运行毫秒级，无需模型文件、GPU 或训练步骤；我们将其作为一个 Python 包发布。

论文其余部分组织如下。第2节 (https://arxiv.org/html/2606.13823#S2) 将该描述子置于无训练谱方法和随机矩阵文献中。第3节 (https://arxiv.org/html/2606.13823#S3) 定义 \(D(\tau)\) 及其嵌入流程。第4节 (https://arxiv.org/html/2606.13823#S4)，即论文核心，阐述了适用性准则：VAR(1) 可辨识性论证、两个先决条件、由此产生的决策规则，以及计算复杂度。第5节 (https://arxiv.org/html/2606.13823#S5) 描述了基准测试和基线方法，第6节 (https://arxiv.org/html/2606.13823#S6) 报告了四个正范式上的点估计值和自助法置信区间。第7节 (https://arxiv.org/html/2606.13823#S7) 确认了标志描述子适用范围的两个负面结果，第8节 (https://arxiv.org/html/2606.13823#S8) 将该方法与学习头和类别感知专家进行了比较。我们在第9节 (https://arxiv.org/html/2606.13823#S9) 中总结。

## 2 相关工作

我们扩展的构造是我们自己的。本团队的一名成员在域间网络流量的随机矩阵研究中引入了对称化时滞相关矩阵 [1 (https://arxiv.org/html/2606.13823#bib.bib1),2 (https://arxiv.org/html/2606.13823#bib.bib2),3 (https://arxiv.org/html/2606.13823#bib.bib3)]，其要点是滞后矩阵的谱将 Marchenko–Pastur 噪声的体与编码被监测系统特征节律的少量异常特征值分离开来。该构造本身是 Laloux 等人 [6 (https://arxiv.org/html/2606.13823#bib.bib6)] 和 Plerou 等人 [7 (https://arxiv.org/html/2606.13823#bib.bib7)] 的等时金融相关矩阵“噪声装饰”的自然滞后推广，其中 Marchenko–Pastur 边缘标记了特征值与纯噪声不一致的边界。本文将此思想带出网络监测领域，并提出以下问题：相同的矩阵，不经修改地计算，是否可作为视频、音频和生理传感器的有用描述子。据我们所知，之前唯一将滞后随机矩阵构造用于图像数据的尝试是 Li 等人 [15 (https://arxiv.org/html/2606.13823#bib.bib15)] 的视觉生活日志研究，该研究操作于单个灰度流，并且未与学习基线进行基准测试。

相同的 Marchenko–Pastur 截断是另一条随机矩阵工作路线的基础，我们从中借鉴了噪声阈值，但未用于描述子本身。Veraart 等人 [9 (https://arxiv.org/html/2606.13823#bib.bib9)] 推广了 MPPCA 作为扩散 MRI 的 patch-Casorati 去噪器，将 MP 边缘应用于局部块协方差矩阵，并从体位置恢复噪声水平 \(\sigma\) 作为自由的副产品；Cordero-Grande 等人 [10 (https://arxiv.org/html/2606.13823#bib.bib10)] 将其扩展到复值信号。我们仅使用 MPPCA 来确认 MP 机制可迁移到图像数据；我们提出的描述子是 \(D(\tau)\) 的特征结构，而非去噪重建。

另外两个系列提供了我们用于对比的无训练基线。Doretto 等人 [11 (https://arxiv.org/html/2606.13823#bib.bib11)] 为每个视频拟合一个线性动态系统 \(x_{t+1}=Ax_t+\nu_t, y_t=Cx_t+w_t\)，从帧堆叠奇异值分解中取 \(C\)，从下一状态对当前状态的最小二乘回归中取 \(A\)，并将 \(A\) 的特征值作为描述子。该构造在视频上功能强大，但通过 SVD 步骤本质上与空间帧结构绑定，而电极通道不具备类似的空间维度，因此该方法是视频特定的。Gu 等人 [12 (https://arxiv.org/html/2606.13823#bib.bib12)] 的 HiPPO 算子则采用固定解析算子的补充路线，导出循环状态空间矩阵 \((A,B)\)，在指定的多项式投影最优性下将输入历史压缩进系数向量；Fourier-boxcar 变体是一个真正的滑动窗口离散傅里叶变换，实现为连续时间线性常微分方程，其中 \(A\) 为纯虚数且 \(\|A_d\|=1\)。一个相关研究线索报告，该算子后接一个单层线性回归头，在 KTH 6 类动作识别上达到约 93%。我们在纯余弦相似度协议下评估相同的算子，无学习头，以便双方比较均是真正的无训练。

对于有监督参考点，我们采用每个基准测试的既定专家方法。基于手工特征的随机森林和支持向量机在 Sleep-EDF 5 类分期上达到约 70-75%，而深度模型 DeepSleepNet[18 (https://arxiv.org/html/2606.13823#bib.bib18)] 和 AttnSleep[23 (https://arxiv.org/html/2606.13823#bib.bib23)] 达到 82-84%。共同空间模式后接线性判别分析 (CSP+LDA) 在 BCI-IV-2a 4 类运动想象上每个受试者达到约 70%，深度方法超过 80%。我们分别与 CSP+LDA 和通道功率谱密度进行比较，作为适当的类别感知和无训练基线。

## 3 方法

#### 设置。
令 \(g \in \mathbb{R}^{T \times N}\) 为一个多元时间序列矩阵：行索引时间，列索引通道（例如，EEG 电极、ECG 导联或音频频带）。该构造对任何此类矩阵同样处理；具有原生通道数的传感器直接使用，低通道传感器按如下所述进行扩充。

#### 预处理。
两个操作去除共享模式和漂移。第一个是**共平均参考 (CAR)**：在每个时间步，我们减去跨通道样本均值，投影出所有通道共有的主导模式。¹对于图像结构输入，这推广为逐帧秩-1 SVD 残差，跨通道均值是一维通道向量的秩-1 模式。第二个是**逐节点 z-score**：\(g_{ti} \leftarrow (g_{ti} - \bar{g}_i)/\sigma_i\)，其中 \(\bar{g}_i, \sigma_i\) 是逐节点的时间均值和标准差。预处理后，\(g\) 的每一列具有零时间均值和单位方差，而跨列均值和方差则不加约束。

¹对于图像结构输入，这推广为逐帧秩-1 SVD 残差，跨通道均值是一维通道向量的秩-1 模式。

#### 时滞相关矩阵。
遵循 Rojkova & Kantardzic [2 (https://arxiv.org/html/2606.13823#bib.bib2)]，定义对称化滞后相关：
\[
D_{ij}(\tau) = \frac{1}{2(T-\tau)} \sum_{t=1}^{T-\tau} \left[ g_i(t) g_j(t+\tau) + g_j(t) g_i(t+\tau) \right].
\]
(1)

\(D(\tau) \in \mathbb{R}^{N \times N}\) 是对称的，因此其特征值为实数。对于 \(\tau=0\)，该构造退化为等时协方差；对于 \(\tau>0\)，它捕获了跨单元相关结构随时间滞后的演变方式。

#### Marchenko–Pastur 体。

多变量时间序列无训练时滞谱嵌入的平稳性与耦合判据

相似文章

随机动力系统中嵌入潜在转移算子的深度谱学习

连续性与序数性的重要性：约束时间序列令牌以利用大语言模型进行有效时间序列分析

嵌套时空时间序列预测

稳定（因而兼容）的表示即所需

多变量时间序列基准中的异常大多数是单变量的

提交意见反馈