面向连续多无人机追踪的拓扑感知时空交接框架
摘要
本文提出了一种用于无人机交通监控的实时多相机多车辆跟踪系统,该系统采用基于拓扑的时空交接机制和确定性队列匹配,在相机视角间保持车辆身份,实现了99.8%的交接成功率。
查看缓存全文
缓存时间: 2026/06/01 15:20
论文页面 - 一种面向连续多无人机跟踪的拓扑感知时空切换框架
来源:https://huggingface.co/papers/2605.15779
摘要
面向实时多摄像头多车辆跟踪系统,通过基于拓扑的时空切换机制和确定性队列匹配算法,解决了无人机交通监控中的轨迹碎片化问题。
将无人机(UAV)集成到智能交通系统(ITS)中,能够为交通监控提供俯视全局视野,但可扩展部署受到轨迹碎片化的阻碍——即跨多无人机视场(FOV)时车辆身份连续性丢失。虽然最先进的框架在优化单无人机影像的局部轨迹提取与稳定性方面表现出色,但往往作为独立数据孤岛运行,生成不连续的轨迹,从而无法进行网络级分析(例如起讫点估计)。本文提出一种实时多摄像头多车辆跟踪(MCMT)系统,旨在处理全局身份连续性。针对俯视视角中基于外观的重识别(Re-ID)存在的视觉模糊性与计算成本,我们引入了一种轻量级的基于拓扑的时空切换机制。我们实现了一个高吞吐量的并行流水线,利用YOLO11和ByteTrack处理并发的4K视频流。我们的核心贡献是一种确定性队列匹配算法,利用几何重叠和虚拟车道离散化,通过先进先出(FIFO)队列预测性地管理身份切换。在复杂城市环境(包括交叉口和合流交通)上的实验结果表明,连续交通流中的切换成功率(HOSR)达到99.8%,显著优于基于重识别的基线方法(74.1%),同时验证了边缘部署的可行性。源代码可在 https://github.com/JYe9/multi-camera-multi-vehicle-tracking-system 获取。
查看 arXiv 页面 (https://arxiv.org/abs/2605.15779) 查看 PDF (https://arxiv.org/pdf/2605.15779) 项目页面 (https://www.jye.me/ICUAS2026/) GitHub1 (https://github.com/JYe9/multi-camera-multi-vehicle-tracking-system) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.15779)
在您的代理中获取此论文:
hf papers read 2605.15779
没有最新的 CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用此论文的模型0
暂无模型关联此论文
请在模型 README.md 中引用 arxiv.org/abs/2605.15779 以在此页面建立链接。
引用此论文的数据集1
jye9/Multi-Camera-Multi-Vehicle-Tracking-System 查看器•1分钟前更新 • 3 (https://huggingface.co/datasets/jye9/Multi-Camera-Multi-Vehicle-Tracking-System)
引用此论文的 Spaces0
暂无 Space 关联此论文
请在 Space README.md 中引用 arxiv.org/abs/2605.15779 以在此页面建立链接。
包含此论文的收藏集0
暂无收藏集包含此论文
请将此论文添加到一个收藏集 (https://huggingface.co/new-collection) 以在此页面建立链接。
相似文章
基于分层冲突感知观测的滑行路径规划值分解强化学习框架
本文介绍了 CaTR,这是一个用于实时多机滑行道路径规划的值分解强化学习框架,它利用分层前瞻性交通表示来平衡安全性与效率。
面向部分可观测环境下自动驾驶的统一风险地图学习
提出了一种面向部分可观测环境的自动驾驶统一风险地图建模框架,该框架通过时空建模和基于扩散的场景生成,整合了交通流风险和碰撞风险。在Waymo Open Motion数据集上,该方法优于最先进的遮挡感知基线。
TrackCraft3R: 改造视频扩散变换器用于密集3D追踪
TrackCraft3R 改造视频扩散变换器,用于从单目视频进行密集3D追踪。它采用双潜在表示和时间RoPE对齐,以比先前方法快1.3倍的速度和少4.6倍的峰值内存,实现了最先进的性能。
OmniDirector: 通用多镜头相机克隆,无需交叉配对数据
一个统一的框架,通过网格运动视频和多模态扩散变换器实现相机运动克隆,无需交叉配对数据即可实现导演级别的控制。
城市交叉口多行人安全预警的数字孪生应用案例
本文提出了一种基于数字孪生框架的城市交叉口多行人安全预警系统,集成了摄像头、超宽带(UWB)、边缘-云计算以及预测轨迹建模技术,实现实时预警。结果表明,该系统具有高准确率和更短的响应时间。