鲁棒最优传输引导的生成式残差域适应:时间域偏移下的共享单车需求预测

arXiv cs.LG 论文

摘要

本文提出了Gen-ROTDA,一种鲁棒最优传输引导的残差域适应框架,用于时间域偏移下的共享单车需求预测,与基线方法相比,在稳定性与准确性上均有提升,尤其适用于含噪目标数据。

arXiv:2605.23115v1 Announce Type: new 摘要:基于历史站点小时数据训练的共享单车模型在后续年份部署时,由于出行模式随时间变化,性能可能会下降。本文将2021年至2026年三月份Citi Bike需求预测作为时间域适应问题进行研究,并提出了Gen-ROTDA,一种鲁棒最优传输引导的残差域适应框架。该方法使用少量标注目标子集拟合目标域站点时间锚点,传输残差而非原始需求,应用确定性标签保留残差特征生成器,并在训练最终残差预测器之前修剪高成本传输匹配。实验将Gen-ROTDA与仅锚点、仅源域、仅目标域、微调、MMD适应、Sinkhorn OTDA、ROTDA和Gen-OTDA进行了比较。Gen-ROTDA在2025至2026主任务上取得了最低的MAE,并且在多年任务中平均上是OT族方法中最佳,尽管微调和MMD适应仍然是整体上的强基线。在异常目标无标签记录下,Gen-ROTDA相比非鲁棒OT变体更加稳定,表明鲁棒传输对于共享单车需求预测中的噪声时间迁移是有用的。
查看原文
查看缓存全文

缓存时间: 2026/05/25 09:00

# 基于鲁棒最优传输引导的残差域自适应方法用于时间域偏移下的共享单车需求预测
来源:https://arxiv.org/html/2605.23115

###### 摘要

基于历史站点小时数据训练的共享单车模型在后期部署时,由于出行模式随时间变化,性能可能会下降。本文将 2021 年至 2026 年三月 Citi Bike 的需求预测问题建模为时间域自适应问题,并提出了 Gen-ROTDA,一种鲁棒最优传输引导的残差域自适应框架。该方法使用少量有标签的目标子集拟合目标域的站点-时间锚点,对残差(而非原始需求)进行迁移,应用一个确定性的标签保持残差特征生成器,并在训练最终残差预测器之前修剪高成本的传输匹配。实验将 Gen-ROTDA 与仅锚点、仅源域、仅目标域、微调、MMD 自适应、Sinkhorn OTDA、ROTDA 和 Gen-OTDA 进行了比较。Gen-ROTDA 在主要的 2025 到 2026 任务上取得了最低的MAE,并且在多年任务的平均表现上是OT家族中最好的方法,尽管微调和MMD自适应仍然是总体上的强基线。在含有异常目标无标签记录的情况下,Gen-ROTDA 比非鲁棒的OT变体稳定得多,表明鲁棒传输对于共享单车需求预测中存在噪声的时间迁移是有用的。

## I. 引言

准确的共享单车需求预测有助于运营商分配单车、平衡站点并维持服务质量[12, 16]。在实际应用中,基于历史站点小时观测数据训练的模型通常会在后续年份部署。这会产生时间域偏移,因为站点热度、通勤行为、骑行者构成以及运营模式可能会随时间变化。这种分布变化是迁移学习和域自适应的核心问题[1, 13],并且它们可能使得直接的源年预测变得不可靠。

跨年的站点小时预测尤其具有挑战性,因为需求是稀疏、偏斜且带有噪声的。许多站点小时的需求较低,而少数站点和高峰时段主导了预测误差。目标特征池也可能包含由异常运营、事件、天气或数据质量问题导致的异常记录。因此,一种有效的自适应方法应在对齐源域和目标域特征分布的同时,在异常目标记录下保持稳定。

最优传输(OT)为域自适应提供了一种对齐经验分布的自然方法[4, 5]。通常通过 Sinkhorn 迭代计算的熵正则化 OT 提高了数值稳定性和可扩展性[6, 14]。然而,标准 OT 仍可能受到匹配不佳或异常样本的影响,因为高成本的匹配会影响传输计划。鲁棒 OT 通过修剪或降低异常传输质量的权重来解决这个问题[10, 11]。

本文提出了 Gen-ROTDA,一种用于共享单车需求预测的鲁棒 OT 引导残差域自适应方法。该方法采用锚点-残差设计:一个目标域站点-时间锚点捕获稳定结构,域自适应仅应用于残差需求分量。然后,Gen-ROTDA 将确定性的标签保持残差特征生成器与鲁棒 OT 修剪相结合。该生成器不是 GAN 或随机生成模型;它是一个残差特征变换网络,将源域残差特征向目标域移动,同时保留与需求相关的信息,遵循通过分布对齐进行可迁移表示学习的更广泛思想[7, 8, 9, 15]。

贡献有三点。首先,我们将跨年 Citi Bike 站点小时预测公式化为一个残差时间域自适应问题。其次,我们提出了 Gen-ROTDA,它结合了标签保持残差特征变换和鲁棒 OT 对齐。第三,我们在2021年至2026年的三月 Citi Bike 数据上,通过主任务、多年任务、鲁棒性、消融和可视化实验对该方法进行了评估。

## II. 数据与预测任务

### II-A Citi Bike 站点小时数据

实验使用从公开的 Citi Bike 系统数据[3]聚合到站点小时观测的 Citi Bike 行程记录。对于站点s和小时t,目标变量为

Ys,t = 从站点s在小时t内开始的行程次数。 (1)

每个观测表示为 (Xs,t, Ys,t)。处理后的数据涵盖 2021 年至 2026 年每年三月的记录。使用相同的日历月份可减少季节性的干扰,并将实验聚焦于跨年的时间偏移。处理后的文件包含站点标识符、站点坐标、日历字段、滞后需求、滚动需求汇总、骑行者及单车类型计数以及比率变量。

主要的残差迁移实验使用一个紧凑的特征划分。变量被分为三组。锚点特征包括空间和日历变量,即 start_lat、start_lng、hour_sin、hour_cos、dow_sin、dow_cos 和 is_weekend。传输特征包括需求历史变量,即 lag_1h、lag_24h、rolling_24h_mean 和 rolling_168h_mean。目标变量是需求,表示要预测的站点小时单车需求量。

传输特征在进行域自适应之前经过 log1p 变换和标准化处理。滞后和滚动特征是根据预测时间之前可用的历史观测数据因果计算得到。因此,预测设定是短期站点小时预测,其中历史需求信息可用,而不是使用未来目标标签构建特征的情况。

### II-B 时间域自适应设定

令

Ds = { (Xi^s, Yi^s) }_{i=1}^{n_s}  (2) 表示带标签的源年样本,且

Dt = { (Xj^t, Yj^t) }_{j=1}^{n_t}  (3) 表示目标年样本。在自适应过程中,目标特征可用,并且使用一个小的带标签目标子集进行锚点拟合和残差校准。保留的目标标签仅用于最终评估。所有比较方法使用相同的带标签目标子集和相同的目标无标签特征池。目标是在

Ps(X,Y) ≠ Pt(X,Y)  (4)

的情况下预测保留的目标需求。

主要任务是 2025 年至 2026 年的迁移。其他任务包括从 2021 年到 2022 年、2022 年到 2023 年、2023 年到 2024 年、2024 年到 2025 年的相邻年迁移,以及从 2021 年到 2023 年、2022 年到 2024 年、2023 年到 2025 年、2024 年到 2026 年的两年迁移。

## III. 方法

图 1 展示了所提出的 Gen-ROTDA 框架,用于目标年份站点小时需求预测。该方法首先将需求分解为一个锚点分量和一个残差分量。然后,它使用一个标签保持生成器将源域残差特征向目标域适配,随后进行鲁棒最优传输对齐以移除匹配较差的样本。最后,使用传输后的源残差和带标签的目标残差训练一个残差预测器,并通过将锚点预测与预测的残差组合得到最终的需求预测。

图 1:提出的 Gen-ROTDA 框架概述,用于站点小时需求预测中的鲁棒残差域自适应。 (图注) 图 1:提出的 Gen-ROTDA 框架概述,用于站点小时需求预测中的鲁棒残差域自适应。

### III-A 锚点-残差分解

直接迁移原始需求可能不稳定,因为需求既包含稳定的站点-时间效应,也包含年份特定的残差动态。因此,我们在对数需求尺度上使用锚点-残差分解。令

z = log(1+Y)。 (5)

一个目标域锚点模型 a_φ(A) 使用带标签的目标样本在锚点特征 A 上进行训练。残差为

r = z − a_φ(A)。 (6)

最终预测为

ẑ = a_φ(A) + r̂,   Ŷ = exp(ẑ) − 1。 (7)

域自适应仅应用于残差预测。这种设计允许小的带标签目标子集校准稳定的站点-时间结构,而源年则贡献可迁移的残差需求模式。

### III-B 标签保持残差特征生成器

令 T 表示标准化的传输特征向量。Gen-OTDA 和 Gen-ROTDA 使用一个确定性的残差特征生成器

G_θ(T) = T + h_θ(T), (8)

其中 h_θ 是一个小型多层感知机。残差形式阻止了过度的特征移动,并使变换后的源特征靠近其原始表示。

该生成器的训练目标是使生成的源特征看起来像目标特征,同时保留残差标签信息,结合了 MMD 自适应的分布匹配思想和标签感知传输的直觉[4, 5, 8, 9]。目标函数为

L_G = L_align(G_θ(T^s), T^t) + λ_id ||G_θ(T^s) − T^s||_2^2
     + λ_lp L_label + λ_sup L_target。 (9)

这里,L_align 是 MMD 风格的分布对齐损失[8, 9],L_label 在生成的源特征上训练一个源残差预测头,L_target 在可用时使用带有标签的目标残差。这一目标使变换后的源特征更类似于目标特征,同时不忽略残差需求信号。

### III-C OT 与鲁棒 OT 对齐

在生成源特征之后,基于 OT 的方法对齐源和目标传输特征分布[4, 5]。对于生成的源特征 T̃_i^s = G_θ(T_i^s) 和目标特征 T_j^t,平方欧氏代价为

C_ij = || T̃_i^s − T_j^t ||^2。 (10)

Sinkhorn OTDA 计算一个熵正则化的传输耦合[6, 14]

π* = argmin_{π ∈ Π(a,b)} ⟨π, C⟩ + ε Σ_{i,j} π_ij (log π_ij − 1)。 (11)

Gen-ROTDA 添加了一个受离群点鲁棒 OT 启发的鲁棒修剪步骤[10, 11]。耦合项按传输代价排序,高成本项被移除,直到保留的耦合质量达到指定的 keep_mass。保留的耦合被重新归一化并用于重心传输:

T̄_i^s = (Σ_j π_ij^{trim} T_j^t) / (Σ_j π_ij^{trim})。 (12)

如果修剪操作移除了某个源行的所有保留质量,实现中会将该行保留为生成的源特征作为后备,以避免未定义的重心投影。最终的残差预测器使用传输后的源残差和带标签的目标残差进行训练,其中带标签的目标残差通过 target_weight 进行加权。

### III-D 比较方法

比较包括九种方法。仅锚点仅使用目标域站点-时间锚点模型,而仅源域在源数据上训练残差预测器并直接应用于目标年。仅目标域仅使用带标签的目标样本训练残差预测器,微调将源残差与加权的带标签目标残差合并。MMD 自适应基于 MMD 进行源自适应或重新加权。OTDA 使用不带生成器或鲁棒修剪的普通最优传输对齐,而 Sinkhorn OTDA 使用不带鲁棒修剪的熵正则化最优传输对齐。ROTDA 应用不带生成器的鲁棒最优传输修剪。Gen-OTDA 将残差特征生成器与非鲁棒最优传输对齐相结合,而 Gen-ROTDA 将残差特征生成器与鲁棒最优传输修剪相结合。

## IV. 实验设置

默认实验使用三月站点小时观测数据。主要实验以 2025 年为源年,2026 年为目标年。随机种子固定为 2026。

实验设置使用了 1,000 个源训练样本和 1,000 个无标签目标样本。最大带标签目标样本数为 500,最大目标测试样本数为 3,000。使用了七个带标签的目标日。传输特征集为 lag_only。目标权重设为 8,Sinkhorn 正则化尺度为 0.1,鲁棒保留质量为 0.8。生成器训练 200 个 epoch。

基础预测模型为随机森林回归器,包含 300 棵树,min_samples_leaf=3[2]。

预测性能在保留的目标站点小时观测上进行评估。主要指标为平均绝对误差 (MAE)、均方根误差 (RMSE) 和 R²:

MAE = (1/n) Σ |Ŷ_i − Y_i|,   (13)
RMSE = ( (1/n) Σ (Ŷ_i − Y_i)^2 )^{1/2},   (14)
R² = 1 − ( Σ (Y_i − Ŷ_i)^2 ) / ( Σ (Y_i − Ȳ)^2 )。   (15)

MAE 是主要指标,因为站点小时需求是稀疏且偏斜的。RMSE 也一并报告,因为它对较大误差更敏感。

## V. 结果

### V-A 主要 2025 到 2026 迁移结果

表 I 报告了主要的 2025 到 2026 年迁移结果。Gen-ROTDA 取得了最低的 MAE,相较于仅源域学习降低了 2.36%,相较于 Sinkhorn OTDA 降低了 0.09%。与 ROTDA 相比,改进较小,因此主要结论并非生成器单独产生了显著的准确性提升。相反,鲁棒传输是 MAE 改进的主要来源,而生成器在此任务中提供了适度的额外收益。

表 I:主要 2025 到 2026 年迁移结果。RMSE 模式有所差异。Gen-OTDA 具有最低的 RMSE 和最高的 R²,而 Gen-ROTDA 具有最低的 MAE。这与鲁棒修剪的目的相符:它在减少较大误差方面效果稍差,但总体上使预测更接近真实值。

相似文章

域随机化与生成模型在机器人抓取中的应用

OpenAI Blog

# 域随机化与生成模型在机器人抓取中的应用 来源:[https://openai.com/index/domain-randomization-and-generative-models-for-robotic-grasping/](https://openai.com/index/domain-randomization-and-generative-models-for-robotic-grasping/) ## 摘要 基于深度学习的机器人抓取在算法改进和数据可用性增加的推动下取得了重大进展。然而,最先进的模型往往仅在数百或数千个未

RAD-2:在生成器-判别器框架中扩展强化学习

Hugging Face Daily Papers

RAD-2 提出了一个用于自动驾驶的统一生成器-判别器框架,将基于扩散的轨迹生成与强化学习优化的重排序相结合,与基于扩散的规划器相比,碰撞率降低了56%。该方法引入了 Temporally Consistent Group Relative Policy Optimization 和 BEV-Warp 仿真环境等技术,以实现高效的大规模训练。

用于离策略时序差分预测的行为感知辅助修正

arXiv cs.AI

本文提出用于离策略时序差分预测的行为感知辅助修正,引入了BA-TDC和BA-TDRC算法,这些算法用行为贝尔曼矩阵替代辅助协方差矩阵,以提高稳定性和收敛性。理论分析和在标准基准上的实验验证了所提方法的有效性。

使用最优传输改进 GANs

OpenAI Blog

OT-GAN 提出了一种新颖的 GAN 变体,在对抗学习的特征空间中结合最优传输和能量距离,以提高训练稳定性和图像生成质量。该方法在基准问题上展示了最先进的结果,使用大批量数据实现了稳定的训练。