PDRNN:基于松耦合无线电与惯性信号流的模块化数据驱动行人航位推算

arXiv cs.LG 论文

摘要

提出了一种名为PDRNN的模块化混合AI辅助行人航位推算系统,该系统结合了循环神经网络与分别用于方向、速度和距离估计的独立机器学习模型,并可选地使用基于无线电的稳定。在动态运动数据上的实验表明,与经典方法和基于机器学习的方法相比,其准确性和精度更优。

arXiv:2605.15252v1 公告类型:新 摘要:现代行人航位推算(PDR)系统依赖于融合从松耦合传感器获取的有噪声且有偏的位置、速度和校准方向估计,以确定定位对象的当前姿态。然而,传感器特定估计方法的采样率差异以及不可靠的传输带来了重大挑战。传统方法往往难以在高速加速度、高速度及方向快速变化的动态运动中有效融合多模态传感器数据。为解决这些限制,我们提出了一种简单的循环神经网络(RNN)架构,能够隐式预测来自不同估计方法沿参考轨迹的异步传感器数据流。该方法引入了PDRNN,一种模块化混合AI辅助的PDR系统,将每个组件处理为独立的机器学习(ML)模型集成,以估计关键参数的均值和方差。采用独立的基于ML的模型从加速度和陀螺仪数据中估计方向、(非)定向速度或距离,并可选择使用同步无线电系统(如5G)提供的绝对定位进行稳定。最终的融合模型结合这些输出(位置、速度和方向),同时利用不确定性估计增强系统鲁棒性。模块化设计允许单独更新、微调或替换组件,而不影响整个系统。在动态运动数据上的实验表明,与经典方法和基于ML的方法相比,PDRNN实现了更高的准确性和精度,有效避免了黑盒方法中常见的误差累积。而且,尽管系统复杂度增加,PDRNN仍具备预测能力,并能更好地控制组件。
查看原文
查看缓存全文

缓存时间: 2026/05/18 06:38

# 模块化数据驱动行人航位推算:基于松耦合无线电与惯性信号流

本研究在 DARCII 项目框架内完成,资助编号 50NA2401,由德国联邦经济事务与气候保护部(BMWK)资助,并得到德国航空航天中心(DLR)、德国联邦网络局(BNetzA)以及德国联邦制图与大地测量局(BKG)的支持。同时,本研究还得到巴伐利亚州经济、基础设施、交通与技术部通过“BAYERN DIGITAL II”(20-3410-2-9-8)框架下的数据分析应用中心(ADA-Center)的支持。来源:https://arxiv.org/html/2605.15252

###### 摘要

现代行人航位推算(PDR)系统依赖于融合由松耦合传感器导出的位置、速度和校准后的方位等噪声及有偏估计,以确定被定位物体的当前姿态。然而,不同传感器特定估计方法的采样率差异以及不可靠的传输带来了显著挑战。传统方法在动态运动中(表现为高加速度、高速度和快速变化的方位)往往难以有效融合多模态传感器数据。为解决这些限制,我们提出了一种简单的循环神经网络(RNN)架构,能够隐式地沿参考轨迹预测来自不同估计方法的异步传感器数据流。所提出的方法引入了 PDRNN——一种模块化混合 AI 辅助 PDR 系统,它将每个组件视为一个独立的机器学习(ML)模型集成,用于估计关键参数的均值与方差。分别采用独立的 ML 模型,根据加速度和陀螺仪数据估计方位、(非)定向速度或距离,并可选择利用同步无线电系统(如 5G)的绝对定位进行稳定性增强。最终的融合模型结合这些输出(位置、速度和方位),同时利用不确定性估计来增强系统鲁棒性。模块化设计允许在不影响整个系统的情况下,对单个组件进行更新、微调或替换。对动态运动体育数据的实验表明,与经典方法和基于 ML 的方法相比,PDRNN 在精度和准确度上表现更优,有效避免了黑箱方法中常见的误差累积问题。尽管系统复杂性增加,PDRNN 仍具备预测能力并提供了更好的组件控制。

## I. 引言

传统 PDR 方法因依赖固定阈值和用户特定的运动学约束,在应对非确定性动态运动和传感器非线性方面存在挑战,尤其是在体育和虚拟现实等复杂环境中。它们严重依赖预定义阈值和运动学约束,导致无法适应非确定性运动和传感器非线性,进而在真实场景中精度和鲁棒性下降。尽管近年基于 ML 的方法(如 RIDI[51 (https://arxiv.org/html/2605.15252#bib.bib1126)] 和 RoNIN[50 (https://arxiv.org/html/2605.15252#bib.bib1127)])通过建模复杂运动提供了更先进的传感器数据建模并实现了更高精度,但它们将整个过程视为黑箱,从而失去了对各个处理步骤的控制,并将误差直接传播到最终位置。这种单体结构牺牲了透明度和灵活性,使得控制或微调单个组件变得困难,并导致传感器不确定性或环境变化时出现不可控的误差累积。因此,经典方法往往过于通用,采用静态阈值处理一般运动学;而现代基于 ML 的模型则常常过于特定,针对特定个体或场景定制。结果,两种方法都经常失败,需要花费大量精力来重新校准传统方法或优化微调黑箱 ML 系统。

请参见图注

图 1:PDRNN 概览:输入传感器数据、位置估计、速度估计、方位估计(不使用磁力计)以及姿态融合。

图 1 (https://arxiv.org/html/2605.15252#S1.F1) 提供了我们方法的概览,该方法通过引入模块化混合 ML 辅助 PDR 系统 PDRNN 来解决现有局限。PDRNN 将每个组件视为一个独立的基于 ML 模型集成(可包含任何类型模型),用于估计关键参数的均值与方差。具体来说,分别采用独立的 ML 模型,根据加速度和陀螺仪测量数据估计方位、速度和距离,并可选择整合来自时间同步射频(RF)系统(如 5G FR1)的绝对位置,用于初始化或稳定 PDR 系统。最终的模型融合这些输出(位置、速度和方位)来计算最终姿态。此外,每个(集成)组件生成不确定性估计,从而增强融合过程的鲁棒性并提高误差恢复能力。PDRNN 的模块化设计提供了更大的灵活性和控制力,允许在不影响整个系统的情况下对单个组件进行更新、微调或替换,从而获得更准确、更鲁棒的位置估计。我们使用来自动态体育运动的传感器数据进行实验,结果表明,这种模块化 ML 辅助 PDR 系统比经典方法和基于 ML 的方法提供了更准确、更精确的姿态估计,并防止了纯黑箱 ML 方法常见的误差累积问题。此外,系统的灵活性使 PDRNN 能够高度适应测量间隙,并允许在不需完全重建系统的前提下进行持续改进。

**贡献。** 本文通过整合多模态传感器数据,在动态环境中实现准确的行人位置跟踪与预测,从而对人类运动估计做出贡献。我们提出了 PDRNN 架构,结合前馈层与 RNN 单元,能够从传感器信号中有效提取时间特征,利用惯性测量和 RF 测量实现准确的姿态与轨迹估计。我们解决了传统方法(如卡尔曼滤波和基于模型的 PDR)在动态运动、传感器噪声以及实时处理方面的难题。通过数据驱动方法,PDRNN 显示出卓越的鲁棒性和准确性,特别是在运动不可预测的体育应用中。我们还展示了 PDRNN 清理噪声传感器数据以及对采样不足的无线电信号进行插值的能力,确保了可靠的姿态估计。PDRNN 对各种运动模式和用户行为具有良好的泛化能力,增强了其在多种场景中的适用性,并为未来在预测方面的进展奠定了基础。与最先进方法相比,我们的方法提供了更高的准确度(高达 90%)、更强的弹性(CEP95:PDR=1.25m, RoNIN=0.46m, PDRNN=0.14m)和更好的预测能力(在 1 秒时 CEP95=0.05m),同时能更好地控制系统组件,尽管代价是更为复杂的混合系统。

**展望。** 第 II 节 (https://arxiv.org/html/2605.15252#S2) 提供相关文献的全面综述。第 III 节 (https://arxiv.org/html/2605.15252#S3) 描述所提出的方法及预处理流水线。第 IV 节 (https://arxiv.org/html/2605.15252#S4) 详细说明实验设置,第 V 节 (https://arxiv.org/html/2605.15252#S5) 展示并讨论结果。最后,第 VI 节 (https://arxiv.org/html/2605.15252#S6) 总结关键发现,为论文作结。

## II. 相关工作

第 II-A 节 (https://arxiv.org/html/2605.15252#S2.SS1) 回顾使用经典、卡尔曼或粒子滤波器进行航位推算或融合惯性测量与无线电定位数据的工作。第 II-B 节 (https://arxiv.org/html/2605.15252#S2.SS2) 介绍采用数据驱动技术的研究。

### II-A. 递归概率方法

为了实现室内外基于无线电的定位,特别是在无线电定位受限或不可用的情况下,一种潜在解决方案是航位推算(DR),它结合了惯性传感器、磁力计和无线电传感器数据[3 (https://arxiv.org/html/2605.15252#bib.bib240)]。一旦检测到位置变化,DR 便根据先前位置估计当前位置[27 (https://arxiv.org/html/2605.15252#bib.bib261)]。因此,当前位置可能包含来自两个系统的误差,例如:(1) 步长和速度因个体身高差异而产生的不准确;(2) 无线电位置受多径干扰影响;(3) 铁磁干扰导致的方位误差[27 (https://arxiv.org/html/2605.15252#bib.bib261), 1 (https://arxiv.org/html/2605.15252#bib.bib442), 44 (https://arxiv.org/html/2605.15252#bib.bib447), 28 (https://arxiv.org/html/2605.15252#bib.bib795)]。

卡尔曼滤波器(KF)常用于融合无线电和惯性传感器数据。通常采用不同的 KF 变体[49 (https://arxiv.org/html/2605.15252#bib.bib598), 30 (https://arxiv.org/html/2605.15252#bib.bib567), 29 (https://arxiv.org/html/2605.15252#bib.bib568), 5 (https://arxiv.org/html/2605.15252#bib.bib555), 48 (https://arxiv.org/html/2605.15252#bib.bib607)] 来考虑传感器的测量噪声。测量协方差通常基于可用训练数据进行优化,而运动模型则针对特定应用定义为尽可能宽泛。然而,这些因素导致融合过程高度依赖具体应用。即使传感器或运动模型存在微小偏差,也会导致测量和过程协方差的误差以及显著的估计误差。

Gusenbauer 等人[22 (https://arxiv.org/html/2605.15252#bib.bib450)] 使用线性 KF 融合 GNSS、磁力计和加速度传感器数据,达到 MAE=4.2m 的精度。Zhuang 等人[53 (https://arxiv.org/html/2605.15252#bib.bib455)] 使用扩展 KF 融合 WLAN 和惯性传感器数据,达到 MAE=4.19m 的精度,并且在抗异常值方面比 Li 等人[34 (https://arxiv.org/html/2605.15252#bib.bib456)] 更稳健(后者达到 MAE=6.2m)。Tao 等人[35 (https://arxiv.org/html/2605.15252#bib.bib462)] 将现有方法的高不准确性归因于附近铁磁金属对磁力计数据的扭曲,这损害了方位估计,进而降低了定位精度。

Sczyslo 等人[46 (https://arxiv.org/html/2605.15252#bib.bib445)] 也使用 KF 来三边定位从超宽带(UWB)定位系统的到达时间(ToA)测量中导出的位置,以及惯性传感器的加速度测量,达到 MAE=0.57m 的精度。KF 状态向量包括 UWB 系统的位置、加速度以及惯性传感器的积分速度。相反,Perttula 等人[43 (https://arxiv.org/html/2605.15252#bib.bib451)] 使用粒子滤波器(PF)融合陀螺仪和加速度计数据与 UWB 无线电系统的 ToA 值,根据传感器放置位置不同达到不同的精度:附着在躯干时 MAE=9.9m,在腰部时 MAE=10.3m。这种变异性表明,即使能够建模非线性运动的 PF 也受到显著误差方差的影响。因此,我们在实验中利用优化的 KF 以尽可能准确的方式代表现有技术。

这些仅依赖当前和先前(马尔可夫)状态(测量和估计)的概率方法无法检测数据间隙或长期数据异常及关系。并且,融合过程的类型和权重是严格预定义的。相反,我们的数据驱动方法 PDRNN 能够直接从训练数据中学习这些挑战,从而实现显著更准确的姿态估计。

### II-B. 数据驱动 ML 方法

尽管一些研究使用 RNN[27 (https://arxiv.org/html/2605.15252#bib.bib261)] 或强化学习[7 (https://arxiv.org/html/2605.15252#bib.bib212)] 来估计速度,以重建距离和未校准轨迹,但在数据驱动方法中,利用多模态信息[38 (https://arxiv.org/html/2605.15252#bib.bib1128), 39 (https://arxiv.org/html/2605.15252#bib.bib1129), 37 (https://arxiv.org/html/2605.15252#bib.bib1130)](例如无线电和惯测量)的方法很少。

Zyner 等人[54 (https://arxiv.org/html/2605.15252#bib.bib210)] 使用 LSTM 单元预测车辆的未来轨迹,利用 GPS 位置、惯性测量单元(IMU)方位和来自里程计传感器的速度,在 90.66% 的情况下准确重建轨迹。然而,参考测量值来自相同数据,这使得比较变得困难。相比之下,Yao 等人[52 (https://arxiv.org/html/2605.15252#bib.bib252)] 通过使用卷积神经网络(CNN)和 RNN 来捕捉来自 IMU 的相对运动和来自 GPS 系统的全局运动,同时模拟信号故障,从而解决了来自 GPS 和 IMU 等信号的传感器噪声。他们的方法达到平均绝对误差 4.043m(SD=0.524m),而传统传感器数据融合方法的平均绝对误差为 6.065m(SD=0.565m)。由于这些初步研究侧重于车辆运动,尚不清楚其概念是否以及如何适用于人体运动。

我们论文的核心概念与 Zyner 等人[54] 和 Yao 等人[52] 的方法一致,但将其方法论扩展到窄带(5G/FR1)和 UWB 无线电定位以及 6DoF 惯性传感器。与先前工作不同,我们进行了全面的架构和参数研究,以确定这些特定领域的最佳轻量级 ML 框架。此外,我们探索了高度动态场景中的瞬态行为,并考察了输入数据流序列长度对数据驱动 PDR 准确度和鲁棒性的影响。我们的方法在这些现有方法论基础之上,通过引入一个模块化混合 PDR 系统来构建,该系统通过独立 ML 模型集成融合无线电和惯性传感器数据。

本质上,文献综述表明,我们的论文是首批公开已知的研究之一,能够在高度动态场景中(表现为速度和方向突变、来自松散放置传感器的噪声惯测量以及多径环境中的无线电信号)使用数据驱动方法实现准确可靠的人体运动检测、跟踪和融合。

## III. 方法论

第 III-A 节 (https://arxiv.org/html/2605.15252#S3.SS1) 首先概述问题,涉及数据间隙、异步数据流以及非确定性校准。随后,第 III-B 节 (https://arxiv.org/html/2605.15252#S3.SS2) 介绍我们提出的方法。第 III-C 节 (https://arxiv.org/html/2605.15252#S3.SS3) 介绍经典方法,第 III-D 节 (https://arxiv.org/html/2605.15252#S3.SS4) 介绍我们的 ML 驱动方法。

### III-A. 问题描述

航位推算构成了许多现代导航应

相似文章

RAD-2:在生成器-判别器框架中扩展强化学习

Hugging Face Daily Papers

RAD-2 提出了一个用于自动驾驶的统一生成器-判别器框架,将基于扩散的轨迹生成与强化学习优化的重排序相结合,与基于扩散的规划器相比,碰撞率降低了56%。该方法引入了 Temporally Consistent Group Relative Policy Optimization 和 BEV-Warp 仿真环境等技术,以实现高效的大规模训练。

城市交叉口多行人安全预警的数字孪生应用案例

arXiv cs.LG

本文提出了一种基于数字孪生框架的城市交叉口多行人安全预警系统,集成了摄像头、超宽带(UWB)、边缘-云计算以及预测轨迹建模技术,实现实时预警。结果表明,该系统具有高准确率和更短的响应时间。

Fast-dDrive: 用于自动驾驶的高效块扩散VLM

arXiv cs.CL

Fast-dDrive是一种用于端到端自动驾驶的块扩散VLA模型,实现了最先进的轨迹精度,同时相比自回归基线提供了超过12倍的吞吐量加速,解决了高保真规划与边缘部署高效推理之间的权衡。