面向连续多无人机追踪的拓扑感知时空交接框架

Hugging Face Daily Papers 论文

摘要

本文提出了一种用于无人机交通监控的实时多相机多车辆跟踪系统,该系统采用基于拓扑的时空交接机制和确定性队列匹配,在相机视角间保持车辆身份,实现了99.8%的交接成功率。

将无人机(UAV)集成到智能交通系统(ITS)中,为交通监控提供了全景视野,然而,可扩展部署受到轨迹碎片化的阻碍,即车辆身份在多无人机视场(FOV)之间丢失。现有最先进的框架在优化单架无人机图像的局部轨迹提取和稳定性方面表现出色,但它们通常作为孤立的数据孤岛运行,产生不连续的轨迹,从而无法进行网络级分析,例如起点-终点估计。本文提出了一种实时的多相机多车辆跟踪(MCMT)系统,旨在处理全局身份持久性。针对俯视视角下基于外观的重识别(Re-ID)存在的视觉模糊性和计算成本问题,我们引入了一种轻量级的基于拓扑的时空交接机制。我们实现了一条高吞吐量并行流水线,利用YOLO11和ByteTrack处理并发的4K视频流。我们的核心贡献是一种基于确定性队列的匹配算法,该算法利用几何重叠和虚拟车道离散化,通过FIFO队列预测性地管理身份交接。在复杂城市环境(包括交叉口和合流交通)上的实验结果表明,在连续交通流中交接成功率(HOSR)达到99.8%,显著优于基于重识别的基线方法(74.1%),同时验证了边缘部署的可行性。源代码可在 https://github.com/JYe9/multi-camera-multi-vehicle-tracking-system 获取。
查看原文
查看缓存全文

缓存时间: 2026/06/01 15:20

论文页面 - 一种面向连续多无人机跟踪的拓扑感知时空切换框架

来源:https://huggingface.co/papers/2605.15779

摘要

面向实时多摄像头多车辆跟踪系统,通过基于拓扑的时空切换机制和确定性队列匹配算法,解决了无人机交通监控中的轨迹碎片化问题。

将无人机(UAV)集成到智能交通系统(ITS)中,能够为交通监控提供俯视全局视野,但可扩展部署受到轨迹碎片化的阻碍——即跨多无人机视场(FOV)时车辆身份连续性丢失。虽然最先进的框架在优化单无人机影像的局部轨迹提取与稳定性方面表现出色,但往往作为独立数据孤岛运行,生成不连续的轨迹,从而无法进行网络级分析(例如起讫点估计)。本文提出一种实时多摄像头多车辆跟踪(MCMT)系统,旨在处理全局身份连续性。针对俯视视角中基于外观的重识别(Re-ID)存在的视觉模糊性与计算成本,我们引入了一种轻量级的基于拓扑的时空切换机制。我们实现了一个高吞吐量的并行流水线,利用YOLO11和ByteTrack处理并发的4K视频流。我们的核心贡献是一种确定性队列匹配算法,利用几何重叠和虚拟车道离散化,通过先进先出(FIFO)队列预测性地管理身份切换。在复杂城市环境(包括交叉口和合流交通)上的实验结果表明,连续交通流中的切换成功率(HOSR)达到99.8%,显著优于基于重识别的基线方法(74.1%),同时验证了边缘部署的可行性。源代码可在 https://github.com/JYe9/multi-camera-multi-vehicle-tracking-system 获取。

查看 arXiv 页面 (https://arxiv.org/abs/2605.15779) 查看 PDF (https://arxiv.org/pdf/2605.15779) 项目页面 (https://www.jye.me/ICUAS2026/) GitHub1 (https://github.com/JYe9/multi-camera-multi-vehicle-tracking-system) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.15779)

在您的代理中获取此论文:

hf papers read 2605.15779

没有最新的 CLI?curl -LsSf https://hf.co/cli/install.sh | bash

引用此论文的模型0

暂无模型关联此论文

请在模型 README.md 中引用 arxiv.org/abs/2605.15779 以在此页面建立链接。

引用此论文的数据集1

jye9/Multi-Camera-Multi-Vehicle-Tracking-System 查看器•1分钟前更新 • 3 (https://huggingface.co/datasets/jye9/Multi-Camera-Multi-Vehicle-Tracking-System)

引用此论文的 Spaces0

暂无 Space 关联此论文

请在 Space README.md 中引用 arxiv.org/abs/2605.15779 以在此页面建立链接。

包含此论文的收藏集0

暂无收藏集包含此论文

请将此论文添加到一个收藏集 (https://huggingface.co/new-collection) 以在此页面建立链接。

相似文章

面向部分可观测环境下自动驾驶的统一风险地图学习

Hugging Face Daily Papers

提出了一种面向部分可观测环境的自动驾驶统一风险地图建模框架,该框架通过时空建模和基于扩散的场景生成,整合了交通流风险和碰撞风险。在Waymo Open Motion数据集上,该方法优于最先进的遮挡感知基线。

TrackCraft3R: 改造视频扩散变换器用于密集3D追踪

Hugging Face Daily Papers

TrackCraft3R 改造视频扩散变换器,用于从单目视频进行密集3D追踪。它采用双潜在表示和时间RoPE对齐,以比先前方法快1.3倍的速度和少4.6倍的峰值内存,实现了最先进的性能。

城市交叉口多行人安全预警的数字孪生应用案例

arXiv cs.LG

本文提出了一种基于数字孪生框架的城市交叉口多行人安全预警系统,集成了摄像头、超宽带(UWB)、边缘-云计算以及预测轨迹建模技术,实现实时预警。结果表明,该系统具有高准确率和更短的响应时间。