平稳性感知的检索增强时间序列预测

arXiv cs.LG 2026/06/04 04:00 论文

摘要

SARAF是一种平稳性感知的检索增强预测框架，它自适应地平衡时间序列预测中检索的相关性与多样性，并基于数据集级别的平稳性调节多样化强度，以处理非平稳状态转移。该工作已被KDD 2026接收，在8个真实世界数据集上展现出了优于强基线的竞争性能。

arXiv:2606.04135v1 公告类型: 新摘要：时间序列预测依赖于历史模式，但真实世界序列往往表现出非平稳性和状态转移，这对全参数化预测器构成了挑战。受检索增强生成（RAG）启发，最近的工作通过检索相关的历史片段并在推理时将其作为外部证据来增强预测器。然而，由于真实世界时间序列固有的非平稳性，高度相似的过去片段并不一定意味着相似的未来，这使得仅基于相似性的检索脆弱且易产生冗余。我们提出了平稳性感知的检索增强时间序列预测（SARAF），这是一种自适应平衡检索中相关性与多样性的框架。SARAF首先通过时间对齐增强的时间相似性构建候选池，然后采用多样性感知的选择策略覆盖异质的历史状态，其中多样化强度根据数据集级别的平稳性自动调节。此外，SARAF使用平稳性感知的聚合来融合检索到的未来。在八个真实世界数据集上的大量实验表明，SARAF取得了有竞争力的预测性能，并在平均准确率和鲁棒性上优于强基线，尤其是在具有挑战性的非平稳设置下优势明显。代码: https://github.com/ShiqiaoZhou/SARAF。

查看原文

查看缓存全文

缓存时间: 2026/06/05 02:21

# 面向平稳性感知的检索增强时间序列预测
来源：https://arxiv.org/html/2606.04135
###### 摘要

时间序列预测依赖于历史模式，但现实世界中的序列通常呈现出非平稳性和状态转移，这对纯参数化预测模型构成了挑战。受检索增强生成（RAG）的启发，近期工作通过检索相关历史片段并在推理时将其作为外部证据来增强预测模型。然而，由于现实世界时间序列固有的非平稳性，高度相似的过去片段并不一定意味着相似的未来，这使得仅基于相似性的检索变得脆弱且容易产生冗余。我们提出了**面向平稳性感知的检索增强时间序列预测（SARAF）**，这是一个自适应平衡检索中相关性与多样性的框架。SARAF首先通过时间对齐增强的时间相似性形成候选池，然后应用感知多样性的选择策略以覆盖异质性的历史状态，其中多样化强度由数据集级别的平稳性自动调节。此外，SARAF使用平稳性感知的聚合来融合检索到的未来序列。在八个真实世界数据集上的大量实验表明，SARAF实现了有竞争力的预测性能，并在强基线基础上提高了平均准确率和鲁棒性，尤其在挑战性的非平稳设置下优势明显。代码：https://github.com/ShiqiaoZhou/SARAF。

时间序列预测；检索增强预测；非平稳时间序列

© Shiqiao Zhou, Holger Schöner, Zipeng Wu, Edouard Fouché, IAG Wilson, and Shuo Wang — ACM 2026。本文是作者被KDD 2026接受的论文版本。最终版本记录将发布在：http://doi.org/10.1145/3770855.3817813。

††copyright:cc ††ccs:信息系统 信息检索 ††ccs:应用计算 预测

## 1. 引言

时间序列预测是一个长期存在的问题，在交通（Lippi 等人，2013 (https://arxiv.org/html/2606.04135#bib.bib19)）、能源（Daut 等人，2017 (https://arxiv.org/html/2606.04135#bib.bib18)）、金融（Poon and Granger，2003 (https://arxiv.org/html/2606.04135#bib.bib29)）和气候（Price 等人，2025 (https://arxiv.org/html/2606.04135#bib.bib1)）等领域具有广泛影响。给定历史上下文，目标是预测指定预测范围内的未来值。在过去的几十年里，预测方法已从经典统计模型（如ARIMA（Box 等人，2015 (https://arxiv.org/html/2606.04135#bib.bib20)））演变为现代深度学习方法，后者能更好地捕捉非线性和多变量依赖关系。现代预测模型涵盖从轻量级架构（通常配备归一化和分解以提高效率和性能（Zeng 等人，2023 (https://arxiv.org/html/2606.04135#bib.bib5)；Lin 等人，2024 (https://arxiv.org/html/2606.04135#bib.bib9)））到基于注意力的模型（学习表达性的时间表示，并更好地捕捉复杂多变量动态下的长程依赖关系（Nie 等人，2025 (https://arxiv.org/html/2606.04135#bib.bib15)；Liu 等人，2022 (https://arxiv.org/html/2606.04135#bib.bib38)；Wu 等人，2021 (https://arxiv.org/html/2606.04135#bib.bib26)；Liu 等人，2024b (https://arxiv.org/html/2606.04135#bib.bib27)））。此外，时间序列基础模型（Das 等人，2024 (https://arxiv.org/html/2606.04135#bib.bib33)；Ansari 等人，2024 (https://arxiv.org/html/2606.04135#bib.bib34)；Woo 等人，2024 (https://arxiv.org/html/2606.04135#bib.bib35)）最近作为一种统一的预训练主干出现，从大规模时间序列语料库中学习可转移表示，提高了在异质性和非平稳设置下的泛化能力。

参考图注：图1. 一个启发SARAF的示例：在720-输入和96-预测范围设置下，x轴显示测试输入与其检索到的训练输入之间的皮尔逊相关系数相似度（按输入相似度排名），y轴显示对应的检索未来与真实未来之间的皮尔逊相关系数相似度。对比一个更平稳的数据集（Electricity）和一个非平稳的数据集（Exchange）表明，较高的输入相似度排名并不一定对应较高的未来相似度排名；一些检索到的未来与真实值几乎零相似，这表明在非平稳条件下，仅基于相似度的检索可能很脆弱。更多示例见附录B (https://arxiv.org/html/2606.04135#A2)。

受检索增强生成（RAG）在大语言模型中成功（Lewis 等人，2020 (https://arxiv.org/html/2606.04135#bib.bib21)）的启发，近期工作（Han 等人，2025 (https://arxiv.org/html/2606.04135#bib.bib14)；Ning 等人，2025 (https://arxiv.org/html/2606.04135#bib.bib23)；Chen 等人，2025 (https://arxiv.org/html/2606.04135#bib.bib24)）探索了检索增强预测，这是一种明确检索历史相似片段作为外部证据并将其集成到预测流程中的范式。这种检索机制可以在训练和测试期间纳入，使模型能够学习如何利用检索到的模式，同时保留根据实例特定参考调整预测的灵活性。通过检索相关的历史案例，预测模型可以将其预测建立在具体的连续序列上，而不仅仅依赖于训练中吸收的模式。这对长尾行为尤其有利：损失最小化倾向于优先处理频繁出现的状态，因此罕见但重要的模式通常被纯参数化预测模型所忽略，而检索则给模型提供了额外机会来获取少数密切相关的历史片段作为显式参考。

然而，大多数现有的检索增强预测模型隐含地假设“相似的过去意味着相似的未来”，因此基于输入历史执行仅基于相似度的Top-K检索。为了探究这一假设，我们在720-输入和96-预测范围设置下进行了一个简单的诊断实验，如图1 (https://arxiv.org/html/2606.04135#S1.F1)所示。具体来说，我们选择了两个广泛使用的时间序列预测基准：Electricity和Exchange，作为本次诊断的代表性案例。为了展示平稳性的相关性，我们报告了ADF（增广迪基-富勒）平稳性比率（Dickey and Fuller, 1979 (https://arxiv.org/html/2606.04135#bib.bib40)），定义为通过ADF检验拒绝单位根原假设的通道比例。在此定义下，Electricity中97.2%的通道被归类为平稳，而Exchange中只有12.5%的通道是平稳的。对于每个测试实例，我们计算其输入片段与训练集中所有候选片段的皮尔逊相关系数相似度，进行排名，并检索前10个最近邻。然后，我们计算每个检索到的邻居的未来片段与测试实例的真实未来之间的皮尔逊相关系数相似度，并将跨测试样本的结果进行聚合，得到图中的排名统计量。重要的是，图1 (https://arxiv.org/html/2606.04135#S1.F1)报告了用于检索的输入相似度排名与反映检索到的未来有用性的未来相似度排名之间的斯皮尔曼等级相关系数\(\rho\)。

从图1 (https://arxiv.org/html/2606.04135#S1.F1)可以看出，对于Electricity，\(\rho=1.000\)表明几乎完全一致的排名行为：在输入空间中更相似的邻居也倾向于产生与真实未来持续正相关且相似度相对较高的未来，这使得基于相似度的Top-K检索基本可靠。相比之下，对于Exchange，\(\rho=0.285\)表明在实践中仍然存在明显的排名错配：输入相似度不是未来相似度的可靠代理，许多检索到的未来与真实值几乎没有相似性。

这种鲜明对比表明，在高度非平稳的数据集上，仅基于相似度的检索可能会变得脆弱，因为“相似的过去”可能对应于明显不同的未来。这种脆弱性在滑动窗口数据库中常常带来实际问题：检索到的Top-K结果经常高度冗余。特别是，冗余检索通过返回近乎重复的证据浪费了有限的Top-K预算，降低了有效信息含量。更重要的是，在非平稳性下，重复但不匹配的案例可能被聚合成误导性的“共识”，放大错误，甚至导致严重退化的检索排名和不稳定的预测。在实践中，许多检索增强预测模型（Ning 等人，2025 (https://arxiv.org/html/2606.04135#bib.bib23)；Han 等人，2025 (https://arxiv.org/html/2606.04135#bib.bib14)；Du 等人，2025 (https://arxiv.org/html/2606.04135#bib.bib31)；Liu 等人，2025 (https://arxiv.org/html/2606.04135#bib.bib32)）采用一种简单的保护措施：当检索到的证据看起来不可靠时，降低其权重，以减少其在训练和推理中的影响。然而，这种衰减有两个关键限制：(i) 它不能解决根本原因——基于输入的检索与未来相关性之间的错配；(ii) 它可能过度抑制部分有用的邻居，实质上使模型回归到纯参数化预测器，从而削弱检索在长尾或特定模式上的优势。

为此，我们提出了**SARAF**，一个**平稳性感知**的检索增强预测框架，旨在提高分布偏移和异质性状态下的证据质量。SARAF建立在两个关键思想上。首先，我们引入了一种**时间对齐的检索增强**，明确优先选择来自历史对齐时间段（例如，相同的小时或星期几）的候选。这提供了超出形态学的额外匹配维度，减少了“形态相似但时间不匹配”的邻居，这些邻居通常产生不一致的未来。值得注意的是，这种线索在平稳和非平稳数据集上都广泛适用，因为时间对齐有助于恢复真正可比较的上下文。

其次，SARAF使检索在**选择和融合**上实现**平稳性自适应**。我们引入了一种简单的平稳性估计方法。在低平稳性数据集上，仅基于相似度的检索是脆弱的，SARAF加强多样性感知的选择以覆盖异质性状态并减少冗余，并使用更平滑的融合，将非平凡权重分布到更多检索到的未来上以提高鲁棒性。在高平稳性数据集上，SARAF优先考虑最相似的邻居，并应用更锐利的聚合，将权重集中在排名靠前的未来上以保持精度。最后，我们采用轻量级的融合，简单地将检索结果与朴素预测取平均，使整个流程能够直接受益于检索到的证据。

我们的主要贡献是：

- 我们实验性地证明了基于相似度的检索的可靠性强烈依赖于数据集：检索结果与真实未来之间的未来相似度随平稳性水平显著变化。
- 我们提出了SARAF，一个平稳性感知的检索增强预测框架，结合了(i) 时间对齐的检索增强和(ii) 由简单数据集级平稳性估计器引导的、基于平稳性控制的多样性检索与自适应融合。
- 我们在八个数据集上进行了广泛实验，表明SARAF在强基线上实现了有竞争力的预测性能，在不同平稳性水平的数据集上均表现出有用的增益和鲁棒行为。

## 2. 相关工作

### 2.1. 时间序列预测

时间序列预测已从经典统计模型发展到深度表示学习。传统方法如ARIMA（Box 等人，2015 (https://arxiv.org/html/2606.04135#bib.bib20)）假设平稳性且可解释，但通常难以处理非线性动态和高维依赖关系。深度学习通过循环模型（如LSTM（Hochreiter and Schmidhuber, 1997 (https://arxiv.org/html/2606.04135#bib.bib3)））和概率框架（如DeepAR（Salinas 等人，2020 (https://arxiv.org/html/2606.04135#bib.bib2)））缓解了这些局限性。Transformer进一步改进了长程建模，出现了注重效率的设计，如Informer（Zhou 等人，2021 (https://arxiv.org/html/2606.04135#bib.bib4)）和Autoformer（Wu 等人，2021 (https://arxiv.org/html/2606.04135#bib.bib26)），它们降低了注意力成本并注入了归纳偏置。同时，社区重新审视了架构复杂性：DLinear（Zeng 等人，2023 (https://arxiv.org/html/2606.04135#bib.bib5)）表明简单的归一化线性映射可能具有很强的竞争力，从而推动了诸如PatchTST（Nie, 2022 (https://arxiv.org/html/2606.04135#bib.bib6)）等具有补丁级令牌化的精炼表示。除了时间域，频率和周期建模仍然活跃，其中TimesNet（Wu 等人，2022 (https://arxiv.org/html/2606.04135#bib.bib8)）、CycleNet（Lin 等人，2024 (https://arxiv.org/html/2606.04135#bib.bib9)）和MoFo（Ma 等人，2025 (https://arxiv.org/html/2606.04135#bib.bib10)）在异质性动态下显式编码多周期性。现实世界的序列也表现出强烈的非平稳性，伴随分布和概念漂移。RevIN（Kim 等人，2021 (https://arxiv.org/html/2606.04135#bib.bib11)）提供了一种轻量级的归一化补救措施，而非平稳Transformer（Liu 等人，2022 (https://arxiv.org/html/2606.04135#bib.bib38)）和SAN（Liu 等人，2023 (https://arxiv.org/html/2606.04135#bib.bib12)）通过去平稳化注意力和动态归一化引入自适应性，以保留有信息的非平稳线索。相比之下，TimeBridge（Liu 等人，2024a (https://arxiv.org/html/2606.04135#bib.bib13)）警告说，过度激进的平稳化可能会消除长期多变量结构，并提出了双尺度表示学习。

尽管如此，大多数预测模型优化的是频繁出现的主导模式，这可能导致长尾中的罕见或新兴状态被建模不足。检索增强预测通过将检索到的历史类比与当前上下文结合来缓解这一问题，注入实例特定的证据，从而提高超越静态模型参数所能捕获的鲁棒性。

### 2.2. 检索增强时间序列预测

随着RAG在大语言模型中的兴起，时间序列预测社区越来越多地探索基于检索的机制以改进长程预测。现有方法大致可分为两类。

**作为输入增强的检索。** 一条常见的工作路线是检索历史片段并将其与查询上下文一起提供给预测模型。例如，TimeRAG（Zhang 等人，2025 (https://arxiv.org/html/2606.04135#bib.bib22)）对时间序列片段进行聚类，并使用DTW检索相似实例，然后将它们提供给LLM生成预测。RAFT（Han 等人，2025 (https://arxiv.org/html/2606.04135#bib.bib14)）通过多周期匹配和皮尔逊相关系数进行检索，并利用检索到的*未来*片段增强原始输入以进行预测。近期的方法，如RAF（Li, 2025 (https://arxiv.org/html/2606.04135#bib.bib30); Tire 等人，2024 (https://arxiv.org/html/2606.04135#bib.bib42)）、TRACE（Chen 等人，2025 (https://arxiv.org/html/2606.04135#bib.bib24)）以及

平稳性感知的检索增强时间序列预测

相似文章

语义增强的检索增强时间序列预测

检索机制在时间序列预测中超越长上下文缩放

SAGA：一种序列自适应生成架构，用于多步概率预测与自适应时间共形预测

嵌套时空时间序列预测

对稀疏且爆发式漏洞目击进行建模：数据受限下的预测

提交意见反馈