语义增强的检索增强时间序列预测

arXiv cs.AI 2026/06/16 04:00 论文

摘要

提出SERAF，一种用于时间序列预测的多模态检索增强框架，该框架同时利用数值相似性和自生成的文本描述来检索历史模式，从而改善非平稳条件下的预测。在七个真实世界数据集上的实验表明，其效果优于最先进的基线模型。

arXiv:2606.14941v1 公告类型：新摘要：时间序列预测模型通常受益于历史模式。受检索增强生成（RAG）的启发，近期研究探索了检索相关历史时间序列段以增强预测。然而，仅依赖时间序列相似性在非平稳条件下往往不足以进行检索。为解决这一问题，我们提出了一种多模态方法：\textbf{S}emantics-\textbf{E}nhanced \textbf{R}etrieval-\textbf{A}ugmented Time Series \textbf{F}orecasting 框架，即 SERAF。与仅依赖时间序列相似性的主流方法不同，SERAF 对时间序列及其自生成的文本描述进行双重检索。它检索两组互补的历史模式及对应的未来，这些模式被有选择地联合用于指导未来预测。在七个真实世界数据集上的实验表明，与最先进的基线模型相比，SERAF 在弥合时间序列的数值视图和语义视图方面具有有效性。

查看原文

查看缓存全文

缓存时间: 2026/06/16 11:43

# 语义增强的检索增强时序预测
来源：https://arxiv.org/html/2606.14941
###### 摘要

时序预测模型通常受益于历史模式。受检索增强生成（RAG）启发，近期的研究探索了检索相关历史时序片段以增强预测。然而，在非平稳条件下，仅依赖时序相似性进行检索往往不够充分。为此，我们提出一种多模态方法：语义增强的检索增强时序预测框架 SERAF。与仅依赖时序相似性的主流方法不同，SERAF 对时序及其自生成的文本描述进行双重检索。它检索两组互补的历史模式及其对应的未来序列，并选择性地联合使用这些信息来指导未来预测。在七个真实世界数据集上的实验表明，与最先进的基线相比，SERAF 在桥接时序的数值视图和语义视图方面具有有效性。

时序预测，检索增强生成，多模态检索

## 1 引言

多变量时序预测根据历史观测预测未来轨迹，是交通（Lippi 等，2013 (https://arxiv.org/html/2606.14941#bib.bib8)）、能源（Daut 等，2017 (https://arxiv.org/html/2606.14941#bib.bib6)）、金融（Poon 和 Granger，2003 (https://arxiv.org/html/2606.14941#bib.bib19)）和气候（Price 等，2025 (https://arxiv.org/html/2606.14941#bib.bib7)）等领域的核心任务。方法已从经典统计模型（如 ARIMA（Box 等，2015 (https://arxiv.org/html/2606.14941#bib.bib9)））发展到深度预测器，例如 DLinear（一种鲁棒的基于 MLP 的线性模型（Zeng 等，2022 (https://arxiv.org/html/2606.14941#bib.bib2)））和 PatchTST（使用补丁级时序表示（Nie 等，2025 (https://arxiv.org/html/2606.14941#bib.bib3)））。最近，基于 LLM 的方法（如 Time-LLM（Jin 等，2023 (https://arxiv.org/html/2606.14941#bib.bib4)）和 GPT4TS（Zhou 等，2023 (https://arxiv.org/html/2606.14941#bib.bib5)））利用文本上下文将背景知识注入预测中。

支持上下文感知生成最广泛采用的方法是检索增强生成（RAG），它从大型外部数据库中检索相关文档，并已成为现代 LLM 流水线的关键组成部分（Lewis 等，2020 (https://arxiv.org/html/2606.14941#bib.bib10)）。受 RAG 启发，近期关于时序预测的研究探索了基于检索的方法，该方法构建历史数据库以检索相似模式，从而显式利用整个历史来指导未来预测。这一方向的代表性工作包括：RAFT（引入多周期进行基于检索的预测（Han 等，2025 (https://arxiv.org/html/2606.14941#bib.bib1)））；TimeRAG（将检索到的序列集成到基于 LLM 的预测器中（Yang 等，2025 (https://arxiv.org/html/2606.14941#bib.bib14)））；TRACE（将外部文本与时序对齐以进行多模态检索（Chen 等，2025 (https://arxiv.org/html/2606.14941#bib.bib13)））；TS-RAG（通过自适应检索增强时序基础模型（TSFM）（Ning 等，2025 (https://arxiv.org/html/2606.14941#bib.bib12)））；以及 TimeRAF（将通道提示融入检索增强的 TSFM（Zhang 等，2025 (https://arxiv.org/html/2606.14941#bib.bib11)））。

然而，对于具有挑战性的非平稳时序，大多数检索方法仍局限于时序相似性（Han 等，2025 (https://arxiv.org/html/2606.14941#bib.bib1)；Yang 等，2025 (https://arxiv.org/html/2606.14941#bib.bib14)；Ning 等，2025 (https://arxiv.org/html/2606.14941#bib.bib12)；Zhang 等，2025 (https://arxiv.org/html/2606.14941#bib.bib11)），而多模态方法通常依赖大型外部文本语料库或 LLM 生成的描述，导致效率低下和可扩展性有限（Chen 等，2025 (https://arxiv.org/html/2606.14941#bib.bib13)）。为弥补这一差距，我们提出 SERAF，一个语义增强的检索增强时序预测框架。除了通过时序相似性检索相关模式外，SERAF 还引入了一个基于直接从时序片段生成的文本描述的语义检索模块。SERAF 从时间和语义两个角度执行检索，并自适应地融合检索结果以增强预测，所有这些都在一个轻量级流水线中完成，无需外部标注或特定领域的文本。

这很有用，因为两个时序片段可能在原始尺度或局部形状上不同，同时共享诸如季节、趋势和波动性等高层属性。通过将这些属性索引为文本，SERAF 可以检索语义相关的历史未来，这些未来在时序相似性上不一定是最接近的，从而在不依赖外部文本资源的情况下补充数值检索。

我们的主要贡献总结如下：

- • 我们提出了一种基于文本描述的新型语义检索策略，丰富了纯数值时序相似性之外的检索过程。
- • 文本描述是从时序片段自动生成的，无需外部文本，从而确保效率和可扩展性。
- • 在七个真实世界数据集上的大量实验证明了 SERAF 的预测提升效果。

参见图 1：SERAF 概述。每个检索到的时序对包含一个历史时序片段及其对应的未来。参见图 2：时序文本描述示例。
## 2 方法

### 2.1 问题形式化

给定一个历史输入序列 \(\mathbf{X}_{t-L+1:t}=\{\mathbf{X}_{t-L+1},\mathbf{X}_{t-L+2},\dots,\mathbf{X}_{t}\}\in\mathbb{R}^{L\times C}\)，其中 \(L\) 是回顾窗口，\(C\) 是通道数，目标是预测接下来 \(H\) 个时间步的 \(\mathbf{Y}_{t+1:t+H}=\{\mathbf{Y}_{t+1},\mathbf{Y}_{t+2},\dots,\mathbf{Y}_{t+H}\}\)。

### 2.2 概述

如图 1 (https://arxiv.org/html/2606.14941#S1.F1) 所示，SERAF 同时从时间和语义信息进行检索增强预测。给定一个输入时间序列，一个可训练的编码器产生一个朴素预测，同时从时序数据库中检索时序相似的历史片段。并行地，输入序列的文本描述由冻结的文本模型嵌入，以从对齐的描述数据库中检索语义相似的描述。来自两个模态的检索到的未来序列经过高斯加权、融合，然后与朴素预测进行门控，最后投影产生最终预测。这种语义检索维度丰富了超越时间模式的搜索空间，从而改进了预测。

### 2.3 时序数据库和时序描述数据库

我们通过在训练集上以步长 1 滑动长度为 \(L\) 的窗口来构建时序（TS）数据库，以实现密集的历史覆盖。每个片段与其长度为 \(H\) 的未来序列配对。时序数据库为 \(\mathcal{D}_T = \{(\mathbf{P}_T^i, \mathbf{F}_T^i)\}_{i=1}^N\)，其中每个配对包含一个历史片段 \(\mathbf{P}_T^i\) 及其未来 \(\mathbf{F}_T^i\)。

并行地，我们通过使用预定义模板为 \(\mathcal{D}_T\) 中的每个配对生成一个自然语言描述来构建时序描述数据库。如图 2 (https://arxiv.org/html/2606.14941#S1.F2) 所示，每个描述包括时间段、季节、主要趋势和主要波动性。时间段和季节来自时间戳，而趋势和波动性使用最频繁的通道级模式。趋势分为上升、下降或平稳，波动性分为高、中或低。我们将数据库记为 \(\mathcal{D}_S = \{\mathbf{Q}_S^i\}_{i=1}^N\)，其中每个描述 \(\mathbf{Q}_S^i\) 对应于 \(\mathcal{D}_T\) 中的 \(\mathbf{P}_T^i\)。

### 2.4 基于时序相似性的检索

对于时序检索，给定第 \(j\) 个输入序列 \(\mathbf{X}^j\)，我们使用相似度函数 \(sim\) 计算 \(\mathbf{X}^j\) 与 \(\mathcal{D}_T\) 中每个历史片段 \(\mathbf{P}_T^i\) 之间的相似度分数 \(\rho_{ij}\)：

\[\rho_{ij}=sim(\mathbf{X}^j,\mathbf{P}_T^i),\quad i\in[1,N].\tag{1}\]

我们使用皮尔逊相关性，因为它减少了尺度变化和值偏移的影响，同时强调了单调趋势（Han 等，2025 (https://arxiv.org/html/2606.14941#bib.bib1)）。为避免泄漏，在训练期间排除 \(\mathcal{D}_T\) 中与输入重叠的历史片段。有效索引集为：

\[\mathcal{I}_{\text{valid}}=\begin{cases}
\{i\in[1,N]\mid i\notin[\max(1,j-(L+H-1)),\min(N,j+(L+H-1))]\}, & \text{if training},\\
\{i\in[1,N]\}, & \text{otherwise}.
\end{cases}\tag{2}\]

Top-\(K\) 索引集 \(\mathcal{K}_T^j\) 和检索集 \(\mathcal{R}_T^j\) 为：

\[\mathcal{K}_T^j = \text{Top-}K\{\rho_{ij}\mid i\in\mathcal{I}_{\text{valid}}\},\ |\mathcal{K}_T^j|=K,\tag{3}\]
\[\mathcal{R}_T^j = \{(\mathbf{P}_T^k,\mathbf{F}_T^k)\mid k\in\mathcal{K}_T^j\}.\tag{4}\]

\(K\) 个检索到的片段通过高斯核加权，赋予较高相似度更大的权重：

\[\alpha_T^{kj} = \frac{\exp\left(-\frac{(1-\rho_{kj})^2}{2\tau^2}\right)}{\sum_{i\in\mathcal{K}^j}\exp\left(-\frac{(1-\rho_{ij})^2}{2\tau^2}\right)},\tag{5}\]

其中 \(\tau\) 是高斯带宽。

基于时序相似性检索到的未来为：

\[\hat{\mathbf{F}}_T^j = \sum_{k\in\mathcal{K}_T^j}\alpha_T^{kj}\,\mathbf{F}_T^k.\tag{6}\]

### 2.5 基于语义相似性的检索

对于语义检索，我们使用与图 2 (https://arxiv.org/html/2606.14941#S1.F2) 相同的模板为输入 \(\mathbf{X}^j\) 生成文本描述 \(\mathbf{Q}^j\)。这直接从时间序列本身提取属性，无需外部文本。一个冻结的文本嵌入模型将 \(\mathbf{Q}^j\) 编码为 \(\mathbf{E}^j\)，并将每个历史描述 \(\mathbf{Q}_S^i\) 编码为 \(\mathbf{E}_S^i\)。语义相似度计算为：

\[s_{ij}=sim(\mathbf{E}^j,\mathbf{E}_S^i),\quad i\in[1,N],\tag{7}\]

其中 \(sim\) 是余弦相似度。类似于公式 4 (https://arxiv.org/html/2606.14941#S2.E4)，我们检索 Top-\(K\) 个时序对并定义：

\[\mathcal{R}_S^j = \{(\mathbf{P}_T^k,\mathbf{F}_T^k)\mid k\in\mathcal{K}_S^j\},\tag{8}\]

其中 \(\mathcal{K}_S^j\) 是 Top-\(K\) 索引集。检索到的片段按照公式 5 (https://arxiv.org/html/2606.14941#S2.E5) 加权，得到：

\[\hat{\mathbf{F}}_S^j = \sum_{k\in\mathcal{K}_S^j}\alpha_S^{kj}\,\mathbf{F}_T^k.\tag{9}\]

### 2.6 融合与最终预测

为自适应平衡语义检索和时间检索的贡献，它们的聚合未来 \(\hat{\mathbf{F}}_S^j\) 和 \(\hat{\mathbf{F}}_T^j\) 首先通过一个可学习的权重进行融合：

\[\hat{\mathbf{F}}^j = w\,\hat{\mathbf{F}}_S^j + (1-w)\,\hat{\mathbf{F}}_T^j,\tag{10}\]

其中 \(w\in(0,1)\) 是一个可训练参数。

除了两个检索模块外，输入 \(\mathbf{X}^j\) 通过一个线性时序（TS）编码器以产生朴素预测 \(\hat{\mathbf{X}}^j\)。然后通过门控机制将该输出与 \(\hat{\mathbf{F}}^j\) 自适应集成，动态平衡它们的相对贡献：

\[\mathbf{G}^j = \beta\,\hat{\mathbf{X}}^j + (1-\beta)\,\hat{\mathbf{F}}^j,\quad \beta=\sigma\left(W[\hat{\mathbf{X}}^j;\hat{\mathbf{F}}^j]\right).\tag{11}\]

其中 \([\cdot;\cdot]\) 表示拼接，\(W\) 是一个可学习的投影，\(\sigma(\cdot)\) 是 sigmoid 函数。

最后，表示 \(\mathbf{G}^j\) 通过一个输出投影映射到最终预测 \(\hat{\mathbf{Y}}^j\)，模型通过最小化均方误差（MSE）损失进行训练。

## 3 实验

### 3.1 实验设置

**数据集。** 我们在七个广泛使用的多变量时序数据集上训练和评估 SERAF：ETTh1、ETTh2、ETTm1、ETTm2、Exchange、Weather 和 Electricity（Wu 等，2021 (https://arxiv.org/html/2606.14941#bib.bib15)）。

表 1：SERAF 与基线在七个数据集上的比较。所有结果均使用相同的输入时间序列长度=720 并在四个预测长度（96、192、336、720）上取平均。最佳结果以**粗体**显示，次优结果以下划线显示。

**基线。** 我们将 SERAF 与七个最先进的时序预测模型进行比较。Autoformer（Wu 等，2021 (https://arxiv.org/html/2606.14941#bib.bib15)）和 PatchTST（Nie 等，2025 (https://arxiv.org/html/2606.14941#bib.bib3)）是基于 Transformer 的预测器。TimeMixer（Wang 等，2024 (https://arxiv.org/html/2606.14941#bib.bib20)）是一个基于 MLP 的多尺度混合模型。DLinear（Zeng 等，2022 (https://arxiv.org/html/2606.14941#bib.bib2)）采用轻量级但鲁棒的线性模型。RAFT（Han 等，2025 (https://arxiv.org/html/2606.14941#bib.bib1)）通过基于时序相似性的多周期检索模块增强了线性模型。CycleNet（Lin 等，2024 (https://arxiv.org/html/2606.14941#bib.bib18)）在线性骨干上显式捕捉周期模式。TimesNet（Wu 等，2023 (https://arxiv.org/html/2606.14941#bib.bib17)）通过傅里叶分析检测主导周期。

**实现细节。** 我们遵循 RAFT（Han 等，2025 (https://arxiv.org/html/2606.14941#bib.bib1)）的实验设置。批量大小设置为 32，并使用 Adam 优化器。输入长度设置为 720，\(\tau\) 设置为 0.1。我们使用 all-MiniLM-L6-v2 作为文本嵌入模型。所有实验均在单个 NVIDIA A100 GPU 上进行。表中报告的每个结果都是通过三次独立运行重现并取平均得到的。

### 3.2 主要结果

预测结果如表 1 (https://arxiv.org/html/2606.14941#S3.T1) 所示。SERAF 在所有四个 ETT 数据集上取得了最佳 MSE，并在其中三个数据集上取得了最佳或并列最佳的 MAE，在 ETTh2 上取得次佳 MAE。与基于检索的基线 RAFT 相比，SERAF 在所有七个数据集上匹配或改进了两个指标，平均 MSE 和 MAE 分别降低了 2.56% 和 1.42%。与 CycleNet 相比，SERAF 的平均 MSE 和 MAE 分别降低了 2.95% 和 1.34%。这些结果表明，语义检索始终优于仅时序相似性检索，尽管其收益在那些仅通过粗略语义描述难以捕捉未来动态的数据集上可能不太明显。

语义增强的检索增强时间序列预测

相似文章

平稳性感知的检索增强时间序列预测

检索机制在时间序列预测中超越长上下文缩放

嵌套时空时间序列预测

SEMA-RAG：一种用于医学推理的自进化多智能体检索增强生成框架

LEAF：事件增强预测的实时基准

提交意见反馈