用于三维场景中无人水下航行器噪声频谱预测的神经辐射噪声场

arXiv cs.AI 2026/06/04 04:00 论文

underwater-acoustics neural-fields noise-prediction uuv 3d-scene-modeling deep-learning acoustic-sensing

摘要

本文提出了神经辐射噪声场（NRNF），一种将水下航行器辐射噪声频谱建模为三维位置、姿态和频率连续函数的神经网络方法。在湖上试验数据上的评估结果表明，该模型在多种泛化设置下，于50–5000 Hz频段内的平均预测误差为3.5 dB。

arXiv:2606.04008v1 Announce Type: cross Abstract: 无人水下航行器（UUV）的辐射噪声是表征声学特征、评估平台性能的重要指标。为解决传统基于物理建模和数值仿真方法对目标结构信息及环境边界条件的强依赖性问题，以及其无法在三维场景中实现连续空间频谱响应建模的局限，本文提出了一种神经辐射噪声场（NRNF）。NRNF将UUV辐射噪声频谱表示为UUV三维位置、水听器三维位置、UUV偏航角以及频率的连续函数，支持在任意空间位置进行基于查询的预测。所提方法采用正弦编码对位置和频率进行表征，并引入可学习的三维场景特征网格，以显式表达环境结构与声传播效应。本文基于湖上试验构建了频谱预测数据集，并在三种设置下对所提模型进行了评估：水平外推、深度外推和跨航次泛化。结果表明，NRNF在50至5000 Hz频段内的平均预测误差为3.5 dB。其中，水平外推难度最低，深度外推难度最高，跨航次泛化难度居中。进一步的消融实验表明，场景特征网格显著提升了模型的预测稳定性和空间泛化能力。

查看原文

查看缓存全文

缓存时间: 2026/06/05 02:11

# 面向三维场景无人水下航行器噪声频谱预测的神经辐射噪声场

来源：https://arxiv.org/html/2606.04008

吴焱 杨洋 范军 王斌 上海交通大学教育部海洋智能装备与系统重点实验室，上海 200240，中国 通讯作者：yang\_dl@sjtu\.edu\.cn

###### 摘要

无人水下航行器（UUV）的辐射噪声是表征声学特征、评估平台性能的重要指标。针对传统基于物理建模和数值仿真方法对目标结构信息及环境边界条件依赖性强、无法在三维场景中实现连续空间频谱响应建模的问题，本文提出了一种神经辐射噪声场（NRNF）。NRNF 将 UUV 辐射噪声频谱表示为关于 UUV 三维位置、水听器三维位置、UUV 偏航角和频率的连续函数，支持在任意空间位置进行基于查询的预测。该方法采用正弦编码对位置和频率进行编码，并引入可学习的三维场景特征网格，以显式表征环境结构和传播效应。基于湖上试验构建了频谱预测数据集，并在三种设置下对所提模型进行了评估：水平外推、深度外推和跨航次泛化。结果表明，NRNF 在 50–5000 Hz 频段内的平均预测误差为 3.5 dB。水平外推最易，深度外推最难，跨航次泛化难度居中。进一步的消融实验结果表明，场景特征网格显著提升了模型的预测稳定性和空间泛化能力。

## 1 引言

无人水下航行器（UUV）已被广泛应用于海洋观测、资源勘探和水下作业。在航行过程中，UUV 产生的水下辐射噪声会影响周围的声学环境，并直接决定平台在被动声学探测条件下的可探测性及其声学隐蔽性能\[5 (https://arxiv.org/html/2606.04008#bib.bib1),9 (https://arxiv.org/html/2606.04008#bib.bib2),29 (https://arxiv.org/html/2606.04008#bib.bib3)\]。

辐射噪声频谱是分析声学特性的重要手段，通常由连续谱和线谱两部分组成\[15 (https://arxiv.org/html/2606.04008#bib.bib4)\]。在浅水波导环境中，观测到的频谱不仅由 UUV 内部激励源、结构传递路径和辐射过程决定，还受环境传播效应的影响，包括海面和海底边界引起的多径传播、频率相关的衰减与干涉，以及海洋参数的变化\[2 (https://arxiv.org/html/2606.04008#bib.bib5)\]。

现有关于 UUV 辐射噪声频谱——特别是线谱和连续谱分量——形成机制和预测建模的研究，长期以来依赖理论分析和数值仿真。这些方法大体可分为以下几类：（1）结构振动–声辐射耦合建模方法，主要用于分析船体、船载机械设备和推进系统结构振动产生的辐射噪声，典型方法包括有限元法\[10 (https://arxiv.org/html/2606.04008#bib.bib6)\]、边界元法\[4 (https://arxiv.org/html/2606.04008#bib.bib7)\]，以及结合面积分公式与边界元求解器用于外部声辐射的混合方法\[23 (https://arxiv.org/html/2606.04008#bib.bib14)\]。（2）基于波导的水下声学传播建模方法，用于描述辐射噪声在复杂海洋环境中的传播与接收，代表性方法包括抛物方程（PE）法\[6 (https://arxiv.org/html/2606.04008#bib.bib9)\]、简正波理论\[26 (https://arxiv.org/html/2606.04008#bib.bib10)\]和射线声学\[1 (https://arxiv.org/html/2606.04008#bib.bib11)\]。（3）基于流激噪声机制的数值预测方法，首先利用计算流体动力学计算非定常流场和压力脉动，再采用声类比方法（如 Ffowcs Williams–Hawkings 公式）进行远场噪声预测\[18 (https://arxiv.org/html/2606.04008#bib.bib12),13 (https://arxiv.org/html/2606.04008#bib.bib13)\]。（4）基于统计能量和简化假设的高频噪声分析方法，如统计能量分析\[19 (https://arxiv.org/html/2606.04008#bib.bib8)\]，常用于复杂结构系统中高频振动和噪声能量传递的快速评估。

上述方法共同构成了预测 UUV 水下辐射噪声的重要技术基础，并在不同频段、空间尺度和应用场景中展现了有效性。然而，尽管这些方法在物理解释和数值建模方面具有重要价值，它们通常需要较为详细的目标结构信息和环境边界条件，因而一般更适用于特定场景和工况下的高保真建模。

近年来，以学习模型替代传统数值求解器已催生出若干新方法\[11 (https://arxiv.org/html/2606.04008#bib.bib15),12 (https://arxiv.org/html/2606.04008#bib.bib16),20 (https://arxiv.org/html/2606.04008#bib.bib17)\]。其中一类方法专注于物理约束学习。例如，物理信息神经网络（PINNs）将声学控制方程直接纳入损失函数，通过自动微分计算偏微分方程残差，并与边界条件和初始条件联合优化\[16 (https://arxiv.org/html/2606.04008#bib.bib18)\]，即使在缺乏显式训练数据的情况下也能预测声场。Yoon 等人\[28 (https://arxiv.org/html/2606.04008#bib.bib19)\]通过引入 PE 包络表示，提升了 PINNs 对海洋波导声场的预测能力。为进一步解决高频特征难以学习、训练不稳定等挑战，Tang 等人\[22 (https://arxiv.org/html/2606.04008#bib.bib20)\]提出了一种结合预训练和自适应策略的 PINN 变体，以改善高频表征和泛化能力。与依赖物理约束来弥补数据不足的 PINNs 不同，神经算子学习方法（如 DeepONet）更强调直接从输入函数空间到输出场的映射学习\[7 (https://arxiv.org/html/2606.04008#bib.bib21)\]，训练完成后，推理时可用单次前向传播替代反复数值迭代。Xu 等人\[27 (https://arxiv.org/html/2606.04008#bib.bib22)\]提出将 DeepONet 用作二维 PE 模型的代理求解器，以复数声压和声速信息为输入，让模型学习 PE 公式中平方根算子的近似，从而实现更高效的声学传播建模。

与上述方法不同，隐式神经表示（INR）通常将目标响应视为定义在连续坐标域上的可查询函数，并通过基于坐标的神经网络直接学习从输入条件到输出响应的映射。近年来，INR 在各类声学问题的连续表示方面展现出强大能力。例如，Vengurlekar 等人\[24 (https://arxiv.org/html/2606.04008#bib.bib23)\]利用基于球谐系数的隐式表示对复杂散射场进行建模，从原始一维回波信号中学习三维散射场和方向相关响应。在基于声呐的三维重建领域，Qadri 等人\[14 (https://arxiv.org/html/2606.04008#bib.bib24)\]将场景几何表示为神经隐式函数，并结合可微渲染合成声呐观测数据，实现了稠密三维重建。值得注意的是，INR 还被应用于室内声学领域，用于学习从声源–接收器位置对到空间声学响应的连续映射\[17 (https://arxiv.org/html/2606.04008#bib.bib25),21 (https://arxiv.org/html/2606.04008#bib.bib26)\]。这些研究表明，INR 非常适合描述由空间位置、几何结构和传播条件共同决定的复杂声场响应。

受上述进展的启发，本文将 INR 引入 UUV 辐射噪声的条件建模中，提出了神经辐射噪声场（NRNF）。在该框架下，UUV 和水听器的三维位置，连同 UUV 偏航角和频率，作为输入，对应的功率谱密度（PSD）作为输出进行预测。因此，模型学习的是定义在三维声学场景上的连续频谱响应映射。考虑到海面、海底界面和水介质对浅水波导中声学传播的显著影响，本文进一步将整个场景中 UUV 与水听器之间的几何关系显式编码为场景特征，作为 NRNF 的条件输入。这一设计使模型能够捕捉环境结构和传播效应对 PSD 形成的影响。在此框架下，模型不再仅依赖于离散测量点之间的局部对应关系，而是学习场景结构与频谱响应之间的耦合关系，从而实现对未见过的 UUV–水听器位置对的频谱特性的连续建模与预测。

本文的主要贡献总结如下。第一，与传统水下辐射噪声建模方法针对特定工况和接收位置逐一求解声学响应不同，所提出的 NRNF 将 UUV 辐射噪声 PSD 表示为定义在三维空间和频域上的连续函数，实现了在变化位置、姿态和频率下频谱响应的统一神经场建模。第二，为捕捉浅水环境中传播路径、边界反射和空间结构共同作用所产生的复杂声场特性，引入了可学习的三维场景特征网格，对传播环境进行隐式参数化，使模型在频谱预测时能够融入场景先验，而非仅依赖显式坐标输入。第三，所提框架同时考虑了 UUV 航向变化对辐射噪声的方向性影响，以及场景传播结构对频谱响应的影响，从而增强了对复杂频谱变化的表征能力。上述设计使 NRNF 与基于坐标的回归模型相比，在未见过空间位置处的辐射噪声频谱预测方面具有更强的空间外推能力、更好的场景鲁棒性和更稳定的预测性能。

本文其余部分组织如下。第二节介绍问题建模与任务定义，并引入隐式神经表示框架，以及所提出的 NRNF 模型架构和训练目标。第三节描述实验设置和数据集构建过程。第四节给出不同测试配置下的预测结果，并进行消融实验分析。最后，第五节对全文进行总结，并讨论未来工作的潜在方向。

## 2 模型架构

本节旨在开发一个能够在指定条件下高效预测三维场景中 UUV 辐射噪声频谱的模型。首先给出任务定义，明确所要解决的问题。随后简要回顾隐式神经网络作为连续函数表示的核心概念。在此基础上，引入 NRNF，并展示其在任意环境中捕捉 UUV 辐射噪声频谱特性的能力。最后讨论 NRNF 的参数化方案，以实现在任意场点（包括未见过位置）处的 PSD 预测。

### 2\.1 问题建模

UUV 的辐射噪声主要来源于推进系统和船载机电设备的激励，以及航行过程中产生的水动力噪声和结构振动。这些激励通过船体结构耦合并向周围水中辐射，最终在接收器处形成可观测的噪声信号。由于传播过程受环境边界效应和几何关系的强烈影响，辐射噪声的频谱特性随水环境及声源–接收器相对构型（包括距离、深度和方位）的变化而变化。本文聚焦于在变化工况和位置配置下，预测三维有界水下环境中 UUV 辐射噪声的 PSD。

从建模角度来看，辐射噪声时域信号通常具有高维性（采样点数量往往达到 $10^4$ 量级），且表现出较强的随机性。直接学习从条件参数到时域波形的映射计算代价高昂，且往往难以稳定地捕捉关键信号特征。相比之下，频域表示更直接地反映了噪声在不同频段的能量分布，同时保持适中的维度，更适合预测任务。

特别地，当通过傅里叶变换获得幅度谱时，各频率bins的频谱估计往往表现出明显的随机波动。基于 Welch 方法\[25 (https://arxiv.org/html/2606.04008#bib.bib27)\]的 PSD 估计通过分段、加窗和平均有效降低方差，在保留目标特征谱线的同时生成更平滑的频谱曲线，这一特性有助于神经网络模型的学习和泛化。

采样后的辐射噪声时域信号 $x(t)$ 可在采样率 $f_s$ 下表示为离散序列 $x[n]$。PSD 采用 Welch 方法估计为：

$$\hat{\Phi}_{x}(f)=\frac{1}{M}\sum_{m=1}^{M}\frac{1}{Uf_{s}}\left|\sum_{n=0}^{L-1}x_{m}[n]w[n]e^{-j2\pi kn/N_{fft}}\right|^{2} \tag{1}$$

其中，$\hat{\Phi}_{x}(f)$ 表示信号 $x[n]$ 在频率 $f$ 处的 PSD 估计。索引 $m=1$

用于三维场景中无人水下航行器噪声频谱预测的神经辐射噪声场

相似文章

NoiseRater：用于扩散模型训练的元学习噪声评估

LakeFM：面向水生生态系统的基础模型，使用不规则多变量多深度时间序列数据

用于二维浅水方程的有限体积信息神经网络框架：崎岖的损失景观与数据指导的重要性

基于有理高斯小波神经网络的多无人机分类与检测

用于$\textit{Norne}$油藏系统的连续物理约束神经算子正向建模

提交意见反馈