基于有理高斯小波神经网络的多无人机分类与检测

arXiv cs.LG 论文

摘要

本文提出一种经济高效的无人机检测与分类系统,利用有理高斯小波神经网络处理声音信号,实现对单个及多个无人机(包括集群)的可解释且稳健的性能,优于传统方法。

arXiv:2605.26310v1 公告类型:新 摘要:无人机(UAV)的检测对于保护民用和军用基础设施至关重要。本文提出一种经济高效的无人机检测系统,利用从麦克风获取的声音信号。记录信号通过信号处理流水线,该流水线采用所谓的理性高斯小波作为可解释的自适应特征提取器。这些自适应小波变换嵌入到一个底层小型神经网络中,并与之一同训练,基于所获得的特征检测和分类无人机。这产生了一种物理可解释的机器学习算法,除了分类无人机外,还能够检测无人机集群。我们使用在室内录音室和嘈杂室外环境中收集的数据展示了结果。我们得出结论,所提出的方法在检测和分类单个无人机以及无人机集群方面优于传统机器学习方法,同时保持了高度的可解释性。我们公开发布了所提出方法的实现以供复现。
查看原文
查看缓存全文

缓存时间: 2026/05/27 09:07

# 基于有理高斯小波神经网络的多无人机分类与检测
来源: https://arxiv.org/html/2605.26310
\[1\]\\fnmPéter\\surKovács

\[1\]\\orgdiv数值分析系,\\orgname罗兰大学,\\orgaddress\\streetPázmány Péter sétány,\\city布达佩斯,\\postcode1117,\\country匈牙利

\[2\]\\orgdiv系统与控制实验室,\\orgname匈牙利科学院计算机科学与控制研究所,\\orgaddress\\streetKende utca,\\city布达佩斯,\\postcode1111,\\country匈牙利

\[3\]\\orgnameSzent György 音响与电影艺术技术学校,\\orgaddress\\streetLenhossék utca,\\city布达佩斯,\\postcode1096,\\country匈牙利

\[4\]\\orgdiv数学与计算机科学系,\\orgname瑞士远程教育大学,\\orgaddress\\streetSchinerstrasse,\\cityBrig-Glis,\\postcode3900,\\country瑞士

\[5\]\\orgname西门子交通有限公司,\\orgaddress\\streetGábor Dénes utca,\\city布达佩斯,\\postcode1117,\\country匈牙利

\[6\]\\orgname匈牙利科学院能源研究中心,\\orgaddress\\streetKonkoly-Thege Miklós út,\\city布达佩斯,\\postcode1121,\\country匈牙利

###### 摘要

无人飞行器(UAV)的检测对于保护民用和军事基础设施至关重要。本文提出一种利用麦克风采集的声音信号的低成本UAV检测系统。记录的声音信号经过信号处理流水线,该流水线采用可解释的自适应特征提取器,即所谓的有理高斯小波。这些自适应小波变换被嵌入到一个底层的小型神经网络中,并与之一同训练,以根据提取的特征检测和分类UAV。这产生了一个物理上可解释的机器学习算法,除了对UAV进行分类外,还能够检测UAV集群。我们利用在室内录音棚和嘈杂室外环境中采集的数据展示了我们的结果。我们得出结论,所提方法在检测和分类单个UAV以及无人机集群方面优于传统的机器学习方法,同时保持了高度的可解释性。我们公开了所提方法的实现代码,以确保可重复性。

###### 关键词:

无人机,小波,机器学习,可解释性,神经网络

## 1 引言

近年来,无人飞行器(UAV)的检测与分类已成为一个重要问题。UAV(通常也称为无人机)已成功应用于货物配送、农业及其他民用行业[seidaliyeva2023advances]。另一方面,利用其携带武器和监视设备的能力,UAV在军事领域获得了大量应用,并在现代战场上发挥着越来越重要的作用[DronesBattle, swinney2022review, wang2021counter]。此外,无人机还为犯罪集团提供了一种进行走私等非法活动的低成本手段[samaras2019deep, DedroneWorldwideDroneIncidents],并扰乱工业和空中交通[seidaliyeva2023advances, DedroneWorldwideDroneIncidents]。关于恶意无人机活动所构成的不同威胁,建议参考[seidaliyeva2023advances]和[droneRev2]进行更深入的讨论。

为了应对无人机带来的威胁,开发可靠且价格合理的UAV检测与分类技术十分必要。因此,近期有几项工作研究了利用多种技术进行无人机检测的问题。由于多种原因,无人机的检测与分类是一项困难的测量和信号处理任务。根据UAV的类型,其声音、雷达或视觉特征可能有很大差异[mohsan2023unmanned]。此外,测量设备通常需要在室外环境中运行,面临天气条件的突然变化和显著的背景噪声[mohsan2023unmanned]。所谓无人机集群(多架UAV执行协调任务)的出现,进一步复杂了潜在的防御策略[seidaliyeva2023advances]。

当前最先进的技术[seidaliyeva2023advances, droneRev2]考虑了从不同类型传感器获得的信号,并配合多种信号处理方法以检测无人机活动。由于上述难点,通常认为高性能的UAV检测系统应融合来自不同传感器的多种信号。这种系统的设计还可能取决于其他因素,例如拟保护的基础设施类型、系统总体成本以及环境相关细节(如可预测的天气条件、噪声污染水平等)。尽管如此,依赖于单一测量模式的无人机检测子系统仍是重要的研究领域,因为它们构成了整体无人机检测系统的组成部分。

当前的UAV检测与分类技术可根据其所依赖的测量类型分为四类。基于雷达的方法(例如[radar, tanveer2025from])使用无线电波探测物体。该技术的优点包括对天气条件的鲁棒性、探测距离远,以及能够检测UAV的速度和方向[seidaliyeva2023advances]。然而,由于雷达截面小和飞行高度低,雷达系统很难检测到较小型的无人机。此外,由于所涉及的仪器复杂,基于雷达的系统成本较高。

基于视觉的检测系统通常使用图像处理来分析来自摄像头的录制内容[camera]。这些系统成本效益很高,并能提供UAV的视觉确认,但其性能可能受到能见度和天气条件的限制。此外,视觉检测系统只能在其视线范围内检测到UAV。

另一类有趣的检测方法试图通过捕获和分析无线信号来识别无人机活动。属于这一类别的方法包括[RF1, RF2]。射频分析的好处包括作用距离长,并且能够对不同类型的UAV进行分类。另一方面,这些方法无法识别自主无人机[seidaliyeva2023advances]或通过非无线方式(如碳纤维光纤)控制的无人机[carbon]。

最后,我们提及通过记录周围环境声音来运行的UAV检测系统[sound1, sound2]。这些系统易于部署且成本效益高。基于声音的检测方案的其他优点包括能够对识别出的无人机进行分类、估计UAV的位置[seidaliyeva2023advances],以及能够在无视线接触目标的情况下运行。与声学无人机检测系统相关的困难包括背景噪声滤波以及对风力条件的敏感性。

在本研究中,我们考虑一种新颖的基于声音的无人机检测系统。我们证明,通过使用适当的信号处理方法,所提系统能够:
1. 通过学习目标UAV特有的频率特征,减轻风和其他背景噪声的影响,
2. 根据学习到的特征对UAV类型进行分类,
3. 识别无人机集群,即区分单个UAV入侵和无人机群组入侵。

在本研究中,我们假设待检测的无人机是传统上难以识别的小型电动飞行器[seidaliyeva2023advances, droneRev2]。为了降低系统成本,我们采用了基于微机电系统(MEMS)技术的麦克风以及一种在数学上合理、所谓的模型驱动机器学习(ML)范式。

所提新颖信号处理方案的使用,使我们的方法明显区别于以往基于声音的UAV检测技术。尽管之前在[sound1]和[sound2]中已经引入了对声音信号应用人工智能方法的无人机检测器,但这些方法依赖于传统的机器学习架构。虽然基于深度学习的方法取得了高性能[soundDeep],但模型参数不具有物理意义。因此,此类模型的输出是不可解释的。这对于无人机检测等安全关键应用而言令人担忧。此外,深度神经模型的规模通常需要专用硬件才能实时使用,这可能导致部署和维护成本增加。

相比之下,某些先前的方法[sound1]应用静态特征提取步骤,从录制的声音信号中获取有意义的信息。然后将提取的特征传递给不同的ML模型,这些模型通常比深度学习模型小[soundDeep]。特征通常使用时频变换提取,因此获得的信息是可解释的。另一方面,先前的方法只考虑了静态特征提取器。也就是说,这些方法对每个声音片段应用固定的变换(例如短时傅里叶变换[sound1])。这导致了次优的信号表示,因为特征提取器方法无法适应不同的UAV类型、机动行为和变化的环境条件。

相比之下,我们提出的方法依赖于嵌入到小型神经网络中的自适应特征提取变换。所提模型适用于硬件受限情况下的实时应用,能够从声音信号中提取具有物理意义的信息。此外,它提供了能够适应不同声音特征和变化环境因素的特征变换。

所提出的信号处理流水线属于所谓的模型驱动机器学习方法范畴。这些基于数学的ML模型是完全或部分可解释的,可用于安全关键应用。重要的是,此类方法保留了经典深度学习的泛化能力,至少在部署应用的背景下是如此。最近引入的多种模型驱动ML方法包括基于变分投影的神经网络[kovacs2022VPNet]和核方法[vpsvm]。其他近期的模型驱动ML方法示例包括小波卷积神经网络[wang2021automatic, li2021waveletkernelnet]。

在当前研究中,我们提出一种新的小波卷积层(以及对应的模型驱动神经网络),该层使用所谓的有理高斯小波(RGW)核[RGW]。RGW是最近引入的一类可容许小波,其形态可以通过多个参数进行显著调整。所提出的层可以学习最优母小波的形状,以及有限数量的尺度(对应于伪频率[daubechies1992ten]),这些尺度可用于检测和分类UAV。

下面,我们总结本研究最重要的创新点:
1. 我们提出一种新颖的基于RGW卷积的模型驱动神经网络。所提信号处理模型从录制的声音信号中获取具有物理意义的小波系数。这些自适应提取的特征随后由一个小型神经网络处理,以检测UAV存在并分类UAV类型。
2. 我们证明,所提基于小波核卷积的机器学习模型可用于检测UAV群组的存在。
3. 我们将所提信号处理方法与几种基线机器学习方法进行了比较。我们表明,除了所提模型固有的可解释性外,它在无人机检测方面显著优于传统的ML方法。我们所有的实验都可以完全重现,因为我们在公开的Python实现中提供了所提方法的代码(见文末数据和代码声明)。
4. 我们提出一种低成本、基于声音的UAV检测与分类系统,配备轻量级、可解释的ML信号处理单元。

本文的其余部分组织如下。在第2节中,我们描述了用于采集数据集所使用的硬件以及不同的测量场景。第3节概述了所采集声音信号的最重要特性。这些特性为所提信号处理流水线提供了依据。在第4节中,我们回顾了有理高斯小波[RGW]的一些重要性质,并引入了可解释的RGW卷积层。然后将这些层用于构建一个小型、部分可解释的无人机检测神经网络。第5节详细介绍了我们的实验和结果。最后,在第6节中,我们总结发现并讨论未来的研究方向。

## 2 数据采集

在录音棚环境中,一台音视频录像机(Video Devices PIX 270i)接收来自广角相机的HD-SDI信号,同时产生一个48 kHz的字时钟信号,该信号与视频参考信号锁相。音频录制以192 kHz采样率、24位有符号线性脉冲编码调制(LPCM)格式进行。来自PIX 270i的字时钟被分配到一个主时钟发生器(Apogee Big Ben),该发生器作为倍频器,产生192 kHz参考信号。Big Ben将此同步的192 kHz字时钟提供给音频接口系统(Focusrite RedNet)及相关的数字音频工作站(Pro Tools),确保所有麦克风通道具有统一的时间基准。PIX 270i还录制了视频信号以及来自其中一个麦克风的模拟参考信号,从而允许音频与视频域之间进行精确的后同步。录音棚中使用的麦克风为Brüel & Kjær 4006和搭配CMC5前置放大器的Schoeps MK2,两者均为压力型电声换能器,确保尽可能相位一致的数据采集。

为了模拟与预期系统应用相关的真实环境条件,我们在室外部署了一个配备商用MEMS换能器的麦克风阵列。录制以8 kHz采样率、16位有符号LPCM格式进行。声学环境包含强烈的背景噪声源,如直升机飞过、附近道路交通、人声以及强风。由于四个麦克风安装在一块公共PCB上,并共享相同的信号调理和采集电路,它们的输出在时间上是相互同步记录的。

实验使用了多种市售多旋翼UAV,代表了不同尺寸类别、声学特征和推进配置。DJI Mavic Pro和Mavic Pro 2是可折叠四旋翼飞行器,起飞重量分别约为734克和907克。这两个平台均使用四个两叶旋翼,典型悬停转速范围约为5000–7800 RPM。

DJI Mavic Mini是一款超轻(249克)四旋翼飞行器,配备四个两叶旋翼,由于其螺旋桨直径较小和惯性降低,其基础旋翼频率较高。

在室外测量中,还包括了其他UAV类型:DJI Mavic 3 Pro(958克,4个旋翼)、DJI Avata 2(cinewhoop风格涵道四旋翼,377克,高转速三叶旋翼)以及DJI Matrice 30T,这是一款较大的工业平台,重量约为3.7千克,配备四个

相似文章

面向连续多无人机追踪的拓扑感知时空交接框架

Hugging Face Daily Papers

本文提出了一种用于无人机交通监控的实时多相机多车辆跟踪系统,该系统采用基于拓扑的时空交接机制和确定性队列匹配,在相机视角间保持车辆身份,实现了99.8%的交接成功率。