MoCo-AIS:一种用于船只轨迹相似度计算的对比学习框架
摘要
MoCo-AIS 是一个统一的对比学习框架,用于计算船只轨迹的相似度,并在大规模AIS数据集上进行了评估。
arXiv:2606.17978v1 Announce Type: new
Abstract: 轨迹相似度是分析移动模式的基础任务,对于路径模式提取、移动预测和异常检测等应用至关重要。传统的基于距离的相似度计算方法计算成本高,因此推动了轻量级基于学习的方法的采用。监督方法依赖于从传统距离度量中提取的大量标签,并且通常重复这些度量,从而限制了泛化能力。虽然自监督学习通过对比学习解决了这个问题,但它缺乏一个统一的框架,使得难以比较深度学习(DL)模型以获得一致的轨迹表示。因此,本文提出了MoCo-AIS,一个基于动量对比(MoCo)范式的统一框架,用于学习船只轨迹嵌入,该范式通过正负轨迹对来制定相似度学习。在此框架内,我们在大规模真实世界的船只跟踪AIS数据集上评估了多种领先的DL模型,这些数据集涵盖了不同的航行行为和操作条件。结果表明,我们的框架显著改进了相似度学习,优于现有基线,同时为评估轨迹表示模型提供了一个基准平台。
查看缓存全文
缓存时间: 2026/06/17 05:40
# MoCo-AIS:一种用于船舶轨迹相似性计算的对比学习框架 来源:https://arxiv.org/html/2606.17978 \(2009年6月5日\) ###### 摘要 轨迹相似性是分析移动模式的基础任务,对于路径模式提取、移动预测和异常检测等应用至关重要。传统的基于距离的相似性计算方法计算成本高,促使人们采用轻量级的学习型方法。监督方法依赖于从传统距离度量中衍生的大量标签,并且常常复现这些度量,从而限制了泛化能力。虽然自监督学习通过对比学习解决了这一问题,但它缺乏统一的框架,使得难以比较深度学习(DL)模型以获得一致的轨迹表示。因此,本文提出了MoCo-AIS,一个基于动量对比(MoCo)范式的统一框架,用于学习船舶轨迹嵌入,该框架通过正负轨迹对来公式化相似性学习。在此框架内,我们在大规模、真实的船舶跟踪AIS数据集上评估了多种领先的深度学习模型,这些数据集捕获了不同的航行行为和操作条件。结果表明,我们的框架在相似性学习上显著优于现有基线,同时为评估轨迹表示模型提供了一个基准平台。 AIS数据,轨迹相似性,表示学习,对比学习 ††copyright:acmlicensed††journalyear:2018††doi:XXXXXXX.XXXXXXX††conference:请从您的权利确认邮件中输入正确的会议标题;2018年6月03-05日;纽约州伍德斯托克††isbn:978-1-4503-XXXX-X/2018/06††ccs:信息系统 时空系统††ccs:信息系统 基于位置的服务††ccs:计算方法 神经网络††ccs:应用计算 交通运输 ## 1. 引言 轨迹表示物体在空间中随时间运动的路径。它通常被定义为一系列有序的观测点,每个点关联着空间坐标、时间信息和动态特征。轨迹从多种来源收集,包括GPS设备、传感器网络和自动识别系统(AIS),捕捉人类、车辆、动物以及自然现象(如飓风和龙卷风)的运动(Zheng, 2015 (https://arxiv.org/html/2606.17978#bib.bib191))。轨迹数据的广泛可用性及其与基于位置的服务相结合,使得轨迹分析在学术界和工业界日益重要,同时也支持民用和安全相关应用(Alam等人, 2022 (https://arxiv.org/html/2606.17978#bib.bib190); Fournier等人, 2018 (https://arxiv.org/html/2606.17978#bib.bib104))。 自2004年以来,AIS已成为商业船舶的强制要求,通过持续广播位置和航程相关信息来增强海事安全(Tu等人, 2018 (https://arxiv.org/html/2606.17978#bib.bib144))。大规模历史AIS数据使得船舶运动模式的研究得以广泛开展,包括航线提取、天气感知路由(Troupiotis-Kapeliaris等人, 2025a (https://arxiv.org/html/2606.17978#bib.bib111))、异常行为检测(Sadeghi和Matwin, 2023 (https://arxiv.org/html/2606.17978#bib.bib112))以及移动预测(Troupiotis-Kapeliaris等人, 2025b (https://arxiv.org/html/2606.17978#bib.bib194))。这些分析的核心是轨迹相似性,它量化了两条路径在空间、时间和语义维度上的对齐程度(Chang等人, 2024 (https://arxiv.org/html/2606.17978#bib.bib192))。这一概念支持一系列下游任务,包括轨迹聚类(Alam和Torgo, 2022 (https://arxiv.org/html/2606.17978#bib.bib135))、相似路径搜索(Chen等人, 2005 (https://arxiv.org/html/2606.17978#bib.bib197))、基于特征的轨迹分类(Westerdijk等人, 2019 (https://arxiv.org/html/2606.17978#bib.bib195))、共动模式识别(Ferrero等人, 2018 (https://arxiv.org/html/2606.17978#bib.bib119), 2020 (https://arxiv.org/html/2606.17978#bib.bib118); Tortelli Portela等人, 2022 (https://arxiv.org/html/2606.17978#bib.bib117))以及移动网络提取(Huang等人, 2024 (https://arxiv.org/html/2606.17978#bib.bib196); Spadon等人, 2019 (https://arxiv.org/html/2606.17978#bib.bib103))。 与陆基GPS数据相比,测量船舶轨迹相似性更具挑战性,因为船舶在松散受限的环境中运行,天气条件(如风和洋流)和区域法规会影响运动,导致位置不确定性和频繁的操纵调整(Alam等人, 2024 (https://arxiv.org/html/2606.17978#bib.bib151))。此外,由于突发传输、信号丢失和覆盖不均,AIS消息在长距离航行中往往不规则(Liang等人, 2024 (https://arxiv.org/html/2606.17978#bib.bib169))(Tu等人, 2018 (https://arxiv.org/html/2606.17978#bib.bib144))。 基于距离的方法(例如,Hausdorff距离(Hausdorff, 1914 (https://arxiv.org/html/2606.17978#bib.bib126))和动态时间规整(DTW)(Keogh和Ratanamahatana, 2005 (https://arxiv.org/html/2606.17978#bib.bib128)))通过对齐原始坐标序列并计算逐点距离来测量轨迹相似性,主要捕获几何相似性(Su等人, 2020 (https://arxiv.org/html/2606.17978#bib.bib199); Tao等人, 2021 (https://arxiv.org/html/2606.17978#bib.bib198))。这些方法在移动研究中被广泛采用,用于船舶航线聚类(Alam和Torgo, 2022 (https://arxiv.org/html/2606.17978#bib.bib135))和预测未来船舶运动(Suo等人, 2020 (https://arxiv.org/html/2606.17978#bib.bib200); Alam等人, 2024 (https://arxiv.org/html/2606.17978#bib.bib151))等应用。然而,随着轨迹数据集规模的增大,基于距离的方法面临越来越大的计算瓶颈。 尽管计算成本高,但基于距离的方法因其明确的数学性质,在海事研究中仍然广泛使用(Alam和Torgo, 2022 (https://arxiv.org/html/2606.17978#bib.bib135); Chen等人, 2005 (https://arxiv.org/html/2606.17978#bib.bib197); Westerdijk等人, 2019 (https://arxiv.org/html/2606.17978#bib.bib195); Huang等人, 2024 (https://arxiv.org/html/2606.17978#bib.bib196))。然而,AIS数据的快速增长凸显了对方法的需求:能在较低计算成本下达到可比精度。最近基于学习的方法已经开始使用深度神经网络来解决这一挑战,但它们依赖于使用传统距离度量进行大量标注,并且针对特定度量训练的模型本质上复现该度量(Yao等人, 2019 (https://arxiv.org/html/2606.17978#bib.bib187); Yang等人, 2021 (https://arxiv.org/html/2606.17978#bib.bib185))。这限制了进展,将基于学习的研究局限于逼近现有方法,而非朝着可泛化的轨迹嵌入方向推进。 相比之下,自监督方法利用对比学习来学习可判别的嵌入,这些嵌入保留了轨迹之间的关系结构,无需手动标注(Li等人, 2018 (https://arxiv.org/html/2606.17978#bib.bib166); Liu等人, 2022 (https://arxiv.org/html/2606.17978#bib.bib171); Chang等人, 2023 (https://arxiv.org/html/2606.17978#bib.bib155))。与监督方法(复现预定义度量)或基于重建的模型(侧重于逐点AIS恢复)(Zhang等人, 2018 (https://arxiv.org/html/2606.17978#bib.bib116); Chen等人, 2025 (https://arxiv.org/html/2606.17978#bib.bib115))不同,对比学习通过数据增强(Liu等人, 2022 (https://arxiv.org/html/2606.17978#bib.bib171); Chang等人, 2023 (https://arxiv.org/html/2606.17978#bib.bib155))或距离引导的样本交换策略(Li等人, 2018 (https://arxiv.org/html/2606.17978#bib.bib166))来推断相似性。这一能力对于AIS数据尤其有价值,因为全局相似性标签本身具有模糊性(Ferreira等人, 2022 (https://arxiv.org/html/2606.17978#bib.bib114); Liang等人, 2024 (https://arxiv.org/html/2606.17978#bib.bib169))。然而,大多数研究优先考虑新架构和边际精度提升,而缺乏一致的评估框架,导致实验设置各异(如基线架构、数据集、预处理流程和指标),从而模糊了方法选择如何影响相似性学习。 在本研究中,我们通过学习嵌入函数来解决轨迹相似性问题,该函数将船舶轨迹映射到一个表示空间,其中距离反映了有意义的时空相似性。我们引入了MoCo-AIS,一个通过将轨迹特定增强与可互换的深度编码器架构相结合来适配动量对比(MoCo)(He等人, 2020 (https://arxiv.org/html/2606.17978#bib.bib149))到AIS数据的统一框架。这些编码器旨在捕获空间动态、时间依赖关系和运动模式。在此框架内,对比学习使语义相似的轨迹段嵌入相互靠近,同时将不相似的段分开。这使得可以直接在学习的嵌入空间中测量相似性。我们采用MoCo,因为它使用动量编码器和动态记忆字典,共同提供了大量且一致的负样本,而不需要大批量大小,从而提高了计算效率和训练稳定性。我们的主要贡献如下: - • 我们提出了一个用于学习船舶轨迹嵌入以进行相似性计算的统一框架,并对各种深度学习架构进行了基准测试。 - • 我们使用相似性搜索标准化了评估协议,并将统一的自我监督框架与 (i) 传统相似性度量(Hausdorff和DTW)和 (ii) 自监督学习基线(t2vec和TrajCL)进行了比较。 - • 我们评估了学习到的嵌入的可扩展性(跨不同规模的数据集)和可迁移性(跨不同地理区域)。 - • 我们通过学习到的嵌入和经典度量计算成对相似性矩阵,评估了相对于传统基于距离度量的计算效率,证明了学习到的嵌入提供了更有效和可扩展的轨迹比较。 本文其余部分组织如下。第2节 (https://arxiv.org/html/2606.17978#S2) 回顾了轨迹相似性测量的最新进展。第3节 (https://arxiv.org/html/2606.17978#S3) 介绍了船舶轨迹表示的预备知识和符号。第4节 (https://arxiv.org/html/2606.17978#S4) 介绍了所提出的MoCo-AIS框架,用于学习轨迹嵌入。第5节 (https://arxiv.org/html/2606.17978#S5) 报告了基于真实世界AIS数据集的实验评估和分析。第6节 (https://arxiv.org/html/2606.17978#S6) 总结了本文并提出了未来研究方向。 ## 2. 相关工作 ### 2.1. 基于距离的方法 基于距离的方法使用几何和对齐概念来比较轨迹。Hausdorff距离(Hausdorff, 1914 (https://arxiv.org/html/2606.17978#bib.bib126))量化了轨迹之间的最大空间偏差,但对异常值敏感,因为噪声点会影响结果。动态时间规整(DTW)(Keogh和Ratanamahatana, 2005 (https://arxiv.org/html/2606.17978#bib.bib128))通过扭曲时间和空间序列以使累积距离最小化来对齐轨迹。尽管DTW可以处理不同长度的轨迹,但其计算成本高且仍然对噪声敏感。 除了空间距离,多维相似性度量(MSM)还引入语义轨迹特征来丰富相似性计算(Furtado等人, 2016 (https://arxiv.org/html/2606.17978#bib.bib122))。基于语义特征,从轨迹频率向量构建层次划分树,并使用基于树节点深度的得分来测量相似性(Varlamis等人, 2021 (https://arxiv.org/html/2606.17978#bib.bib121))。随着维度增加,另一项研究提出了高维轨迹特征的索引技术,实现高效的逐点比较和检索(Souza等人, 2022 (https://arxiv.org/html/2606.17978#bib.bib120))。 总之,基于距离的方法依赖于距离度量和子轨迹对齐来产生可解释的相似性得分,这构成了轨迹相似性的基础。然而,这些技术计算密集且对采样密度敏感,限制了其适用性。我们的研究通过学习在潜在空间中编码轨迹的嵌入来解决这些局限性,从而实现高效的相似性检索。 ### 2.2. 基于学习的方法 #### 2.2.1. 监督方法 在监督式轨迹相似性学习中,模型训练通常由传统距离度量指导。特别是,训练涉及使用来自特定度量(例如DTW、LCSS或Hausdorff)的预计算距离来标记轨迹对,从而允许模型学习预测与这些真实测量值一致的相似性值。这些方法利用了各种架构,包括基于RNN的(NeuTraj(Yao等人, 2019 (https://arxiv.org/html/2606.17978#bib.bib187)))、基于CNN的(TrajSR(Cao等人, 2021 (https://arxiv.org/html/2606.17978#bib.bib153)))和基于图注意力的模型(TrajGAT(Yao等人, 2022 (https://arxiv.org/html/2606.17978#bib.bib188)))。然而,大多数开源的轨迹数据集是未标注的,使用基于距离的度量进行标注会带来显著的计算开销。此外,源自特定度量的标签可能固有地使学习到的嵌入偏向于这些监督度量。 #### 2.2.2. 自监督方法 自监督学习方法在训练过程中使用判别性样本来学习保留轨迹之间关系距离的潜在嵌入。这些方法通常依赖于对比或三元组目标来编码相似性结构。例如,t2vec(Li等人, 2018 (https://arxiv.org/html/2606.17978#bib.bib166))对轨迹序列进行令牌化,并应用堆叠GRU与三元组损失(Weinberger和Saul, 2009 (https://arxiv.org/html/2606.17978#bib.bib127))。最近,TrajCL(Chang等人, 2023 (https://arxiv.org/html/2606.17978#bib.bib155))基于MoCo(He等人, 2020 (https://arxiv.org/html/2606.17978#bib.bib149))框架,将增强样本视为正样本,并利用动态记忆库作为负样本,通过InfoNCE损失(Van den Oord等人, 2019 (https://arxiv.org/html/2606.17978#bib.bib129); He等人, 2020 (https://arxiv.org/html/2606.17978#bib.bib149))进行优化。 最近的研究越来越关注编码器设计如何塑造学习到的轨迹嵌入的质量和结构。循环架构仍然广泛用于序列建模(Li等人, 2018 (https://arxiv.org/html/2606.17978#bib.bib166); Zhang等人, 2020 (https://arxiv.org/html/2606.17978#bib.bib131)),而卷积编码器捕获多尺度空间模式(Li等人, 2025 (https://arxiv.org/html/2606.17978#bib.bib168))。基于Transformer的模型通过建模长程依赖关系扩展了这种能力(Liu等人, 2022 (https://arxiv.org/html/2606.17978#bib.bib171))。
相似文章
LongMoE:基于轨迹感知的混合专家模型的纵向多模态学习
LongMoE提出了一个统一框架,同时解决多模态临床学习中的模态缺失和纵向动态问题,利用上下文感知插补、注意力令牌化、轨迹感知编码和稀疏混合专家路由。在ADNI、OASIS-3和MIMIC-IV上的实验表明,在缺失模态情况下鲁棒性得到提升,同时在完整模态设置下仍具有竞争力。
基于AIS的海上异常检测中无监督学习的新型评估指标:MADQI
本文介绍了MADQI,一种在无需标注数据的情况下评估海上AIS数据中无监督异常检测的复合指标。该框架结合了四个指标,在测试数据集上取得了80.37%的MADQI分数。
多模态属性图的上下文感知模态-拓扑协同对齐
提出CoMAG,一个用于多模态属性图的统一骨干网络,它学习任务自适应可靠上下文并执行模态保持对齐,在图级预测、模态匹配和图条件生成上达到最先进结果。
KODA:面向视觉-语言基础模型的对比表示比较与对齐
本文介绍了KODA(Kernel Optimization for Discrepancy Analysis,差异分析核优化),一种基于核的框架,用于比较和对齐视觉-语言模型表示,通过识别在CLIP、SigLIP和BLIP等模型中聚类方式不同的样本子集。该方法使用对比嵌入聚类和随机低维近似,能够扩展到大型数据集,同时提供表示之间可解释的结构差异。
MOSAIC:通过稀疏可加可识别因果学习在科学时间序列中进行模块发现
本文介绍了 MOSAIC,这是一种用于科学时间序列中模块发现的方法,它将因果表征学习与稀疏可加可识别因果学习相结合。其目标是在无需事后对齐的情况下,恢复可解释的潜在变量及其关联观测值,并在分子动力学和气候数据等领域进行了验证。