使用端口-哈密顿神经网络识别非线性弦动力学

arXiv cs.LG 2026/05/14 04:00 论文

port-hamiltonian-neural-networks nonlinear-dynamics system-identification partial-differential-equations physics-informed-machine-learning musical-acoustics gray-box-modeling

摘要

本文扩展了端口-哈密顿神经网络（PHNNs）到偏微分方程（PDEs）中，用于从数据中学习非线性弦动力学。该方法能够同时恢复哈密顿量和耗散，在准确性和可解释性方面优于非物理信息基线方法。

arXiv:2605.12785v1 公告类型: 新摘要：混合机器学习将物理知识与数据驱动模型相结合，以增强可解释性和性能。在此背景下，端口-哈密顿系统（PHS）——它推广了哈密顿力学以描述开放、非自治动力系统——已成功与神经网络集成，称为端口-哈密顿神经网络（PHNNs）。虽然PHNNs识别哈密顿常微分方程（ODE）系统的能力已得到验证，但将其应用于学习哈密顿偏微分方程（PDE）系统仍鲜有探索。这一局限限制了它们在音乐声学中的应用，因为乐器通常被建模为由PDE控制的分布参数系统。在本工作中，我们展示了如何通过将PHNN扩展到PDE，在一个物理一致性的框架中从数据学习非线性弦动力学。通过构建基于PHS的结构化神经网络架构，我们能够同时恢复控制弦的哈密顿量及其所受的耗散。该方法在准确性和可解释性方面均优于基线的非物理信息方法。使用合成数据的数值实验展示了所提出的PHNN模型识别和模拟系统非线性动力学的能力。

查看原文

查看缓存全文

缓存时间: 2026/05/14 06:18

# 使用端口-哈密顿神经网络识别非线性弦动力学

来源：https://arxiv.org/html/2605.12785

Maximino Linares¹,², Guillaume Doras¹, Thomas Hélie¹,³  
¹IRCAM, 1, place Igor\-Stravinsky, 75004, Paris, France  
²Sorbonne Université, 4, place Jussieu, 75005, Paris, France  
³CNRS, 3 rue Michel\-Ange, 75016, Paris, France

###### 摘要

混合机器学习结合物理知识与数据驱动模型，以增强可解释性和性能。在此背景下，端口-哈密顿系统（PHS）——它推广了哈密顿力学以描述开放、非自治的动力系统——已成功与神经网络结合，形成端口-哈密顿神经网络（PHNNs）。虽然PHNNs识别哈密顿常微分方程（ODE）系统的能力已有证明，但其在哈密顿偏微分方程（PDE）系统学习中的应用仍基本未被探索。这一限制制约了它们在音乐声学中的应用，因为乐器通常被建模为受PDE支配的分布参数系统。本文展示了如何通过面向PDE的PHNN扩展，在物理一致性的框架下从数据中学习非线性弦动力学。通过构造基于PHS的结构化神经网络架构，我们能够恢复控制弦的哈密顿量及其阻尼效应。该方法在准确性和可解释性方面均优于非物理信息基线方法。基于合成数据的数值实验表明，所提出的PHNN模型能够识别并模拟系统的非线性动力学。

## 1. 引言

估计、识别与学习都描述类似的概念，尽管不同学科使用不同的术语[6 (https://arxiv.org/html/2605.12785#bib.bib76)]。在机器学习中，目标是从数据中学习模型，以在给定未见输入时预测输出[26 (https://arxiv.org/html/2605.12785#bib.bib82)]。在控制理论中，系统识别通过对系统进行实验，并利用其响应建立一个与观测一致的模型[22 (https://arxiv.org/html/2605.12785#bib.bib71)]。这两个领域有共同目标：创建能够捕捉数据中潜在模式的模型。决定使用哪种模型是复杂的，通常由应用的具体目标驱动。线性模型对于在操作点附近运行的系统尤其有用，因为非线性系统的行为通常可以在局部近似为线性模型[16 (https://arxiv.org/html/2605.12785#bib.bib77)]。当线性模型失效时，灰盒模型利用已知结构将未知参数拟合到数据中[19 (https://arxiv.org/html/2605.12785#bib.bib79)]。这需要领域知识且难以构建，但成功时能提供更深的理解。另一方面，黑盒模型灵活且能拟合几乎任何数据[18 (https://arxiv.org/html/2605.12785#bib.bib81)]，但缺乏可解释性，且通常存在过拟合风险[26 (https://arxiv.org/html/2605.12785#bib.bib82)]。

在本文中，我们考虑一种灰盒识别框架，依赖端口-哈密顿系统（PHS）状态空间表示和神经网络（称为端口-哈密顿神经网络PHNN），来识别拨动非线性吉他弦的动力学。PHS[24 (https://arxiv.org/html/2605.12785#bib.bib3),33 (https://arxiv.org/html/2605.12785#bib.bib2)]将哈密顿力学推广到多物理开放系统，通过端口（输入/输出）显式建模与环境的能量交换以及阻尼。虽然PHS方法可应用于模拟广泛的物理领域，包括声学、流体力学、量子物理等[15 (https://arxiv.org/html/2605.12785#bib.bib83),1 (https://arxiv.org/html/2605.12785#bib.bib36),5 (https://arxiv.org/html/2605.12785#bib.bib35),30 (https://arxiv.org/html/2605.12785#bib.bib37)]，但非线性PHS识别仍鲜有探索（例如参见Cherifi等人[9 (https://arxiv.org/html/2605.12785#bib.bib84)]的综述），且文献中只有少数应用于音频的实例[27 (https://arxiv.org/html/2605.12785#bib.bib85)]。PHNN利用PHS公式，并用多层感知机（MLPs）近似系统的每个组件，在训练和推理阶段保证物理一致性和结构[10 (https://arxiv.org/html/2605.12785#bib.bib9),8 (https://arxiv.org/html/2605.12785#bib.bib18),29 (https://arxiv.org/html/2605.12785#bib.bib16),25 (https://arxiv.org/html/2605.12785#bib.bib86),14 (https://arxiv.org/html/2605.12785#bib.bib87)]。虽然有些工作使用PHNN建模自振荡这一众所周知的声学现象[21 (https://arxiv.org/html/2605.12785#bib.bib88)]，但据我们所知，使用该框架识别分布式音频系统尚未在文献中描述，现有工作基于神经算子[31 (https://arxiv.org/html/2605.12785#bib.bib89),23 (https://arxiv.org/html/2605.12785#bib.bib94)]、Koopman理论[11 (https://arxiv.org/html/2605.12785#bib.bib90)]、可微分数字信号处理[20 (https://arxiv.org/html/2605.12785#bib.bib91)]或模态合成方法[34 (https://arxiv.org/html/2605.12785#bib.bib74),35 (https://arxiv.org/html/2605.12785#bib.bib92),12 (https://arxiv.org/html/2605.12785#bib.bib93)]。

本文遵循Eidnes等人[13 (https://arxiv.org/html/2605.12785#bib.bib24)]的思想，他们提出了一个学习哈密顿偏微分方程的一般框架（作为有限差分离散化），并且与Zhelenov等人[34 (https://arxiv.org/html/2605.12785#bib.bib74),35 (https://arxiv.org/html/2605.12785#bib.bib92)]密切相关，他们通过可微分模态合成方法学习非线性弦动力学。最后，我们考虑一种时间离散化方法，通过结合标量辅助变量（SAV）方法[32 (https://arxiv.org/html/2605.12785#bib.bib73)]、非迭代求解器[3 (https://arxiv.org/html/2605.12785#bib.bib96)]和漂移抑制控制[28 (https://arxiv.org/html/2605.12785#bib.bib72)]，提供了一个高效、显式、保无源性求解器。本文组织如下：第2节 (https://arxiv.org/html/2605.12785#S2)介绍连续和半离散端口-哈密顿公式下的非线性弦模型，第3节 (https://arxiv.org/html/2605.12785#S3)介绍用于识别非线性弦的PHNN模型，第4节 (https://arxiv.org/html/2605.12785#S4)描述数值实验，第5节 (https://arxiv.org/html/2605.12785#S5)讨论结果，第6节 (https://arxiv.org/html/2605.12785#S6)总结本文。

## 2. 非线性弦模型

考虑几何非线性条件下弦的动力学。大变形下弦的横向位移 \(q(x,t)\) 由以下PDE控制：

\[
\partial_{t}^{2}q = \frac{1}{\mu} [(T\partial_{x}^{2} - EI\partial_{x}^{4})q - 2\mu(\eta_{0} - \eta_{1}\partial_{x}^{2})\partial_{t}q + \frac{EA-T}{2}\partial_{x}(\partial_{x}q)^{3} + \delta(x-x_{e})f_{e}],
\tag{1}
\]

其中 \(q \in [0, l_{0}] \in \mathbb{R}\)，弦长 \(l_{0}\) \([m]\)，时间 \(t \in \mathbb{R}^{+}\)。各常数参数为：弦张力 \(T\) \([N]\)，杨氏模量 \(E\) \([Pa]\)，半径 \(R\) \([m]\)，横截面积 \(A = \pi R^{2}\) \([m^{2}]\)，惯性矩 \(I = \pi R^{4}/4\) \([m^{4}]\)，密度 \(\rho\) \([\text{kg}\cdot\text{m}^{-3}]\)，线质量密度 \(\mu = \rho A\) \([\text{kg}\cdot\text{m}^{-1}]\)，阻尼系数 \(\eta_{0}\) 和 \(\eta_{1}\)。控制项 \(f(x,t) = \delta(x-x_{e})f_{e}(t)\) \([N]\) 施加于位置 \(x = x_{e}\)，其中 \(\delta\) 表示狄拉克 delta 函数，\(f_{e}\) 模拟弦的拨动[2 (https://arxiv.org/html/2605.12785#bib.bib75)]：

\[
f_{e}(t) = \frac{1}{2}f_{\text{amp}}\left[1 - \cos\left(\frac{\pi t}{T_{e}}\right)\right], \quad t \in [0, T_{e}]; \quad 0, \quad \text{otherwise}
\]

其中 \(f_{\text{amp}}\) \([N]\) 为激励幅度，\(T_{e}\) \([\text{sec}]\) 为激励持续时间。在端点 \(x=0\) 和 \(x=l_{0}\) 处采用简支边界条件：\(q(0,t)=0\) 且 \(\partial_{x}^{2}q(0,t)=0\)。假设初始条件为零（即对于 \(x \in [0,l_{0}]\)，\(q(x,0) = \partial_{t}q(x,0) = 0\)）。这个简单模型包含了音乐弦建模的一些关键要素（大变形、频率相关损耗）。关于音乐弦模型的更完整综述，请参见Bilbao和Ducceschi[4 (https://arxiv.org/html/2605.12785#bib.bib95)]。表1 (https://arxiv.org/html/2605.12785#S2.T1)展示了以连续和半离散端口-哈密顿PDE形式写出的非线性弦模型。半离散公式通过保结构有限差分获得，其中 \(\mathbf{q} \equiv [q_{1}, \cdots, q_{N-1}]\) 表示横向位移，\(\mathbf{p} \equiv [p_{1}, \cdots, p_{N-1}]\) 表示空间网格 \(N-1\) 个节点上的动量，且 \(q(x_{s}) = q_{s}\)，\(p(x_{s}) = p_{s}\)，网格间距 \(h\) 满足 \(l_{0} = Nh\)。

表1：非线性弦模型：连续 vs 半离散端口-哈密顿（PH）公式

## 3. 弦-PHNN模型

我们将离散哈密顿量 \(H\) 和阻尼矩阵 \(\mathbf{R}_{0}\) 参数化为：

\[
H_{\theta,\theta_{nl}}(\mathbf{q},\mathbf{p}) = \frac{\|\mathbf{p}\|^{2}}{2\rho\pi R^{2}} + \frac{T}{2}\|\mathbf{D}^{-}\mathbf{q}\|^{2} + \frac{E\pi R^{4}}{8}\|\mathbf{D}^{2}\mathbf{q}\|^{2} + H_{\theta_{nl}}(\mathbf{q}).
\tag{2}
\]

以及

\[
\mathbf{R}_{0,\theta} = -\frac{2\rho\pi R^{2}}{h}\eta_{1}\mathbf{D}^{2} + \frac{2\rho\pi R^{2}}{h}\eta_{0}\mathbb{I},
\tag{3}
\]

其中 \(\theta = (\rho, R, T, E, \eta_{0}, \eta_{1})\) 为可学习的正参数，\(H_{\theta_{nl}}(\mathbf{q}) : \mathbb{R}^{N-1} \rightarrow \mathbb{R}\) 是一个神经网络，用于近似哈密顿量的非二次部分。注意，学习 \(H_{\theta_{nl}}(\mathbf{q})\) 提出了如何用神经网络近似空间导数的问题。为了解决这个问题，我们遵循现有文献[7 (https://arxiv.org/html/2605.12785#bib.bib97)]的工作，其中强调了有限差分格式与卷积神经网络之间的联系。例如，一阶向后有限差分算子

\[
[\mathbf{D}^{-}\mathbf{q}]_{s} = \frac{q_{s} - q_{s-1}}{h} = (\mathbf{k} * \mathbf{q})_{s},
\tag{4}
\]

其中 \(\mathbf{k} = \frac{1}{h}[1, -1]\) 是一个大小为2的核。在我们的情况下，自然引入这种学习方法以近似目标哈密顿量 \(H_{nl}(\mathbf{q})\) 的非二次部分，因为它可以写为：

\[
H_{nl}(\textbf{q}) = \frac{EA-T}{8}\|(\textbf{D}^{-}\textbf{q})^{\circ 2}\|^{2} = h\sum_{s=1}^{N-1}\frac{EA-T}{8}\left(\frac{q_{s} - q_{s-1}}{h}\right)^{4}.
\tag{5}
\]

因此，我们构造网络 \(H_{\theta_{nl}}(\mathbf{q})\)，使得对于给定的固定 \(h\)，

\[
H_{\theta_{nl}}(\mathbf{q}) = h\sum_{s=1}^{N-1}\left(f_{\theta_{\text{MLP}}}(\mathbf{k}_{\theta_{k}} * \mathbf{q})\right)^{2},
\tag{6}
\]

该网络输入维度为 \(N-1\)（空间离散点数），包含一个卷积层 \(\mathbf{k}_{\theta_{k}} = [k_{\theta_{k,1}}, k_{\theta_{k,2}}]\)（核大小为2），随后是一个MLP \(f_{\theta_{\text{MLP}}}\)，该MLP相同地应用于第一个卷积层的每个输出。最后，最后一层将 \(N-1\) 个输入求和为一个标量（见图1 (https://arxiv.org/html/2605.12785#S3.F1)）。\(H_{\theta_{nl}}(\mathbf{q})\) 的结构受Eidnes等人[13 (https://arxiv.org/html/2605.12785#bib.bib24)]工作的启发，从物理上源自哈密顿PDE的结构：哈密顿函数的空间离散化给出了空间网格上的黎曼和；利用齐次性假设，允许使用共享卷积算子结合MLP来建模局部非线性能量密度；输出的平方保证了非负的局部能量贡献。在下文中，我们将 \(H_{\theta,\theta_{nl}}\) 和 \(\theta\) 的组合称为StringPHNN。

参见图注

图1：网络 \(H_{\theta_{nl}}\) 包含一个核大小为2的卷积层和一个具有5个隐藏层（每层100个单元）及LeakyReLU激活函数的MLP。

表2：数据集生成参数。

## 4. 数值实验

### A. 问题陈述

给定一个离散参考轨迹 \(\mathcal{T}\)，目标是设计一个PHNN模型，使其能够准确生成一个尽可能逼近 \(\mathcal{T}\) 的轨迹 \(\tilde{\mathcal{T}}\)。使用改进的SAV方法要求用交错网格[17 (https://arxiv.org/html/2605.12785#bib.bib19)]在时间上离散轨迹，使得 \(\mathcal{T} = \{\mathbf{q}_{s}^{t-1/2}, \mathbf{p}_{s}^{t}, f_{e}^{t+1/2}, x_{e}\}\)，其中 \(s \in \{1, \cdots, N-1\}\)，\(t \in \{0, \cdots, T_{s}/dt\}\)。

参见图注

图2：时间交错方案表示，其中变量定义在偏移时刻。

### B. 实现细节

#### i. 数据生成

我们考虑一个非线性弦，其固定配置详见表2 (https://arxiv.org/html/2605.12785#S3.T2)，这保证了我们选择的采样频率 \(f_s = 88.2\,\text{kHz}\) 下的数值稳定性。关于如何选择这些参数的更详细解释见Risse等人[28 (https://arxiv.org/html/2605.12785#bib.bib72)]。数据生成过程与Zhelenov等人[34 (https://arxiv.org/html/2605.12785#bib.bib74)]中详述的类似。用于生成训练、验证和测试数据集的仿真参数列于表2 (https://arxiv.org/html/2605.12785#S3.T2)，其中 \(N_{\text{traj}}\) 是轨迹数量，\(T_s\) 是仿真持续时间。每条轨迹包含每个节点 \(s\) 的位移 \(q_s\) 和动量 \(p_s\) 信息。物理参数对应基频 \(f_0 \approx 55.5\,\text{Hz}\)。该弦由随机生成的激励函数 \(f_e(t)\) 在随机选择的激励位置 \(x_e\) 处根据指定参数范围内的均匀分布进行激励。

#### ii. 训练与测试细节

基线模型由一个MLP组成，其输出...

使用端口-哈密顿神经网络识别非线性弦动力学

相似文章

Quantum Port-Hamiltonian Neural Networks：通过测量诱导非线性学习保守与耗散动力学

从微分几何视角看哈密顿神经网络

基于物理建模的神经网络

用于双材料系统中弹性动力学波传播的物理信息神经网络框架

解锁哈密顿视频动力学模型中的时间泛化

提交意见反馈