使用端口-哈密顿神经网络识别非线性弦动力学
摘要
本文扩展了端口-哈密顿神经网络(PHNNs)到偏微分方程(PDEs)中,用于从数据中学习非线性弦动力学。该方法能够同时恢复哈密顿量和耗散,在准确性和可解释性方面优于非物理信息基线方法。
arXiv:2605.12785v1 公告类型: 新
摘要:混合机器学习将物理知识与数据驱动模型相结合,以增强可解释性和性能。在此背景下,端口-哈密顿系统(PHS)——它推广了哈密顿力学以描述开放、非自治动力系统——已成功与神经网络集成,称为端口-哈密顿神经网络(PHNNs)。虽然PHNNs识别哈密顿常微分方程(ODE)系统的能力已得到验证,但将其应用于学习哈密顿偏微分方程(PDE)系统仍鲜有探索。这一局限限制了它们在音乐声学中的应用,因为乐器通常被建模为由PDE控制的分布参数系统。在本工作中,我们展示了如何通过将PHNN扩展到PDE,在一个物理一致性的框架中从数据学习非线性弦动力学。通过构建基于PHS的结构化神经网络架构,我们能够同时恢复控制弦的哈密顿量及其所受的耗散。该方法在准确性和可解释性方面均优于基线的非物理信息方法。使用合成数据的数值实验展示了所提出的PHNN模型识别和模拟系统非线性动力学的能力。
查看缓存全文
缓存时间: 2026/05/14 06:18
# 使用端口-哈密顿神经网络识别非线性弦动力学
来源:https://arxiv.org/html/2605.12785
Maximino Linares¹,², Guillaume Doras¹, Thomas Hélie¹,³
¹IRCAM, 1, place Igor\-Stravinsky, 75004, Paris, France
²Sorbonne Université, 4, place Jussieu, 75005, Paris, France
³CNRS, 3 rue Michel\-Ange, 75016, Paris, France
###### 摘要
混合机器学习结合物理知识与数据驱动模型,以增强可解释性和性能。在此背景下,端口-哈密顿系统(PHS)——它推广了哈密顿力学以描述开放、非自治的动力系统——已成功与神经网络结合,形成端口-哈密顿神经网络(PHNNs)。虽然PHNNs识别哈密顿常微分方程(ODE)系统的能力已有证明,但其在哈密顿偏微分方程(PDE)系统学习中的应用仍基本未被探索。这一限制制约了它们在音乐声学中的应用,因为乐器通常被建模为受PDE支配的分布参数系统。本文展示了如何通过面向PDE的PHNN扩展,在物理一致性的框架下从数据中学习非线性弦动力学。通过构造基于PHS的结构化神经网络架构,我们能够恢复控制弦的哈密顿量及其阻尼效应。该方法在准确性和可解释性方面均优于非物理信息基线方法。基于合成数据的数值实验表明,所提出的PHNN模型能够识别并模拟系统的非线性动力学。
## 1. 引言
估计、识别与学习都描述类似的概念,尽管不同学科使用不同的术语[6 (https://arxiv.org/html/2605.12785#bib.bib76)]。在机器学习中,目标是从数据中学习模型,以在给定未见输入时预测输出[26 (https://arxiv.org/html/2605.12785#bib.bib82)]。在控制理论中,系统识别通过对系统进行实验,并利用其响应建立一个与观测一致的模型[22 (https://arxiv.org/html/2605.12785#bib.bib71)]。这两个领域有共同目标:创建能够捕捉数据中潜在模式的模型。决定使用哪种模型是复杂的,通常由应用的具体目标驱动。线性模型对于在操作点附近运行的系统尤其有用,因为非线性系统的行为通常可以在局部近似为线性模型[16 (https://arxiv.org/html/2605.12785#bib.bib77)]。当线性模型失效时,灰盒模型利用已知结构将未知参数拟合到数据中[19 (https://arxiv.org/html/2605.12785#bib.bib79)]。这需要领域知识且难以构建,但成功时能提供更深的理解。另一方面,黑盒模型灵活且能拟合几乎任何数据[18 (https://arxiv.org/html/2605.12785#bib.bib81)],但缺乏可解释性,且通常存在过拟合风险[26 (https://arxiv.org/html/2605.12785#bib.bib82)]。
在本文中,我们考虑一种灰盒识别框架,依赖端口-哈密顿系统(PHS)状态空间表示和神经网络(称为端口-哈密顿神经网络PHNN),来识别拨动非线性吉他弦的动力学。PHS[24 (https://arxiv.org/html/2605.12785#bib.bib3),33 (https://arxiv.org/html/2605.12785#bib.bib2)]将哈密顿力学推广到多物理开放系统,通过端口(输入/输出)显式建模与环境的能量交换以及阻尼。虽然PHS方法可应用于模拟广泛的物理领域,包括声学、流体力学、量子物理等[15 (https://arxiv.org/html/2605.12785#bib.bib83),1 (https://arxiv.org/html/2605.12785#bib.bib36),5 (https://arxiv.org/html/2605.12785#bib.bib35),30 (https://arxiv.org/html/2605.12785#bib.bib37)],但非线性PHS识别仍鲜有探索(例如参见Cherifi等人[9 (https://arxiv.org/html/2605.12785#bib.bib84)]的综述),且文献中只有少数应用于音频的实例[27 (https://arxiv.org/html/2605.12785#bib.bib85)]。PHNN利用PHS公式,并用多层感知机(MLPs)近似系统的每个组件,在训练和推理阶段保证物理一致性和结构[10 (https://arxiv.org/html/2605.12785#bib.bib9),8 (https://arxiv.org/html/2605.12785#bib.bib18),29 (https://arxiv.org/html/2605.12785#bib.bib16),25 (https://arxiv.org/html/2605.12785#bib.bib86),14 (https://arxiv.org/html/2605.12785#bib.bib87)]。虽然有些工作使用PHNN建模自振荡这一众所周知的声学现象[21 (https://arxiv.org/html/2605.12785#bib.bib88)],但据我们所知,使用该框架识别分布式音频系统尚未在文献中描述,现有工作基于神经算子[31 (https://arxiv.org/html/2605.12785#bib.bib89),23 (https://arxiv.org/html/2605.12785#bib.bib94)]、Koopman理论[11 (https://arxiv.org/html/2605.12785#bib.bib90)]、可微分数字信号处理[20 (https://arxiv.org/html/2605.12785#bib.bib91)]或模态合成方法[34 (https://arxiv.org/html/2605.12785#bib.bib74),35 (https://arxiv.org/html/2605.12785#bib.bib92),12 (https://arxiv.org/html/2605.12785#bib.bib93)]。
本文遵循Eidnes等人[13 (https://arxiv.org/html/2605.12785#bib.bib24)]的思想,他们提出了一个学习哈密顿偏微分方程的一般框架(作为有限差分离散化),并且与Zhelenov等人[34 (https://arxiv.org/html/2605.12785#bib.bib74),35 (https://arxiv.org/html/2605.12785#bib.bib92)]密切相关,他们通过可微分模态合成方法学习非线性弦动力学。最后,我们考虑一种时间离散化方法,通过结合标量辅助变量(SAV)方法[32 (https://arxiv.org/html/2605.12785#bib.bib73)]、非迭代求解器[3 (https://arxiv.org/html/2605.12785#bib.bib96)]和漂移抑制控制[28 (https://arxiv.org/html/2605.12785#bib.bib72)],提供了一个高效、显式、保无源性求解器。本文组织如下:第2节 (https://arxiv.org/html/2605.12785#S2)介绍连续和半离散端口-哈密顿公式下的非线性弦模型,第3节 (https://arxiv.org/html/2605.12785#S3)介绍用于识别非线性弦的PHNN模型,第4节 (https://arxiv.org/html/2605.12785#S4)描述数值实验,第5节 (https://arxiv.org/html/2605.12785#S5)讨论结果,第6节 (https://arxiv.org/html/2605.12785#S6)总结本文。
## 2. 非线性弦模型
考虑几何非线性条件下弦的动力学。大变形下弦的横向位移 \(q(x,t)\) 由以下PDE控制:
\[
\partial_{t}^{2}q = \frac{1}{\mu} [(T\partial_{x}^{2} - EI\partial_{x}^{4})q - 2\mu(\eta_{0} - \eta_{1}\partial_{x}^{2})\partial_{t}q + \frac{EA-T}{2}\partial_{x}(\partial_{x}q)^{3} + \delta(x-x_{e})f_{e}],
\tag{1}
\]
其中 \(q \in [0, l_{0}] \in \mathbb{R}\),弦长 \(l_{0}\) \([m]\),时间 \(t \in \mathbb{R}^{+}\)。各常数参数为:弦张力 \(T\) \([N]\),杨氏模量 \(E\) \([Pa]\),半径 \(R\) \([m]\),横截面积 \(A = \pi R^{2}\) \([m^{2}]\),惯性矩 \(I = \pi R^{4}/4\) \([m^{4}]\),密度 \(\rho\) \([\text{kg}\cdot\text{m}^{-3}]\),线质量密度 \(\mu = \rho A\) \([\text{kg}\cdot\text{m}^{-1}]\),阻尼系数 \(\eta_{0}\) 和 \(\eta_{1}\)。控制项 \(f(x,t) = \delta(x-x_{e})f_{e}(t)\) \([N]\) 施加于位置 \(x = x_{e}\),其中 \(\delta\) 表示狄拉克 delta 函数,\(f_{e}\) 模拟弦的拨动[2 (https://arxiv.org/html/2605.12785#bib.bib75)]:
\[
f_{e}(t) = \frac{1}{2}f_{\text{amp}}\left[1 - \cos\left(\frac{\pi t}{T_{e}}\right)\right], \quad t \in [0, T_{e}]; \quad 0, \quad \text{otherwise}
\]
其中 \(f_{\text{amp}}\) \([N]\) 为激励幅度,\(T_{e}\) \([\text{sec}]\) 为激励持续时间。在端点 \(x=0\) 和 \(x=l_{0}\) 处采用简支边界条件:\(q(0,t)=0\) 且 \(\partial_{x}^{2}q(0,t)=0\)。假设初始条件为零(即对于 \(x \in [0,l_{0}]\),\(q(x,0) = \partial_{t}q(x,0) = 0\))。这个简单模型包含了音乐弦建模的一些关键要素(大变形、频率相关损耗)。关于音乐弦模型的更完整综述,请参见Bilbao和Ducceschi[4 (https://arxiv.org/html/2605.12785#bib.bib95)]。表1 (https://arxiv.org/html/2605.12785#S2.T1)展示了以连续和半离散端口-哈密顿PDE形式写出的非线性弦模型。半离散公式通过保结构有限差分获得,其中 \(\mathbf{q} \equiv [q_{1}, \cdots, q_{N-1}]\) 表示横向位移,\(\mathbf{p} \equiv [p_{1}, \cdots, p_{N-1}]\) 表示空间网格 \(N-1\) 个节点上的动量,且 \(q(x_{s}) = q_{s}\),\(p(x_{s}) = p_{s}\),网格间距 \(h\) 满足 \(l_{0} = Nh\)。
表1:非线性弦模型:连续 vs 半离散端口-哈密顿(PH)公式
## 3. 弦-PHNN模型
我们将离散哈密顿量 \(H\) 和阻尼矩阵 \(\mathbf{R}_{0}\) 参数化为:
\[
H_{\theta,\theta_{nl}}(\mathbf{q},\mathbf{p}) = \frac{\|\mathbf{p}\|^{2}}{2\rho\pi R^{2}} + \frac{T}{2}\|\mathbf{D}^{-}\mathbf{q}\|^{2} + \frac{E\pi R^{4}}{8}\|\mathbf{D}^{2}\mathbf{q}\|^{2} + H_{\theta_{nl}}(\mathbf{q}).
\tag{2}
\]
以及
\[
\mathbf{R}_{0,\theta} = -\frac{2\rho\pi R^{2}}{h}\eta_{1}\mathbf{D}^{2} + \frac{2\rho\pi R^{2}}{h}\eta_{0}\mathbb{I},
\tag{3}
\]
其中 \(\theta = (\rho, R, T, E, \eta_{0}, \eta_{1})\) 为可学习的正参数,\(H_{\theta_{nl}}(\mathbf{q}) : \mathbb{R}^{N-1} \rightarrow \mathbb{R}\) 是一个神经网络,用于近似哈密顿量的非二次部分。注意,学习 \(H_{\theta_{nl}}(\mathbf{q})\) 提出了如何用神经网络近似空间导数的问题。为了解决这个问题,我们遵循现有文献[7 (https://arxiv.org/html/2605.12785#bib.bib97)]的工作,其中强调了有限差分格式与卷积神经网络之间的联系。例如,一阶向后有限差分算子
\[
[\mathbf{D}^{-}\mathbf{q}]_{s} = \frac{q_{s} - q_{s-1}}{h} = (\mathbf{k} * \mathbf{q})_{s},
\tag{4}
\]
其中 \(\mathbf{k} = \frac{1}{h}[1, -1]\) 是一个大小为2的核。在我们的情况下,自然引入这种学习方法以近似目标哈密顿量 \(H_{nl}(\mathbf{q})\) 的非二次部分,因为它可以写为:
\[
H_{nl}(\textbf{q}) = \frac{EA-T}{8}\|(\textbf{D}^{-}\textbf{q})^{\circ 2}\|^{2} = h\sum_{s=1}^{N-1}\frac{EA-T}{8}\left(\frac{q_{s} - q_{s-1}}{h}\right)^{4}.
\tag{5}
\]
因此,我们构造网络 \(H_{\theta_{nl}}(\mathbf{q})\),使得对于给定的固定 \(h\),
\[
H_{\theta_{nl}}(\mathbf{q}) = h\sum_{s=1}^{N-1}\left(f_{\theta_{\text{MLP}}}(\mathbf{k}_{\theta_{k}} * \mathbf{q})\right)^{2},
\tag{6}
\]
该网络输入维度为 \(N-1\)(空间离散点数),包含一个卷积层 \(\mathbf{k}_{\theta_{k}} = [k_{\theta_{k,1}}, k_{\theta_{k,2}}]\)(核大小为2),随后是一个MLP \(f_{\theta_{\text{MLP}}}\),该MLP相同地应用于第一个卷积层的每个输出。最后,最后一层将 \(N-1\) 个输入求和为一个标量(见图1 (https://arxiv.org/html/2605.12785#S3.F1))。\(H_{\theta_{nl}}(\mathbf{q})\) 的结构受Eidnes等人[13 (https://arxiv.org/html/2605.12785#bib.bib24)]工作的启发,从物理上源自哈密顿PDE的结构:哈密顿函数的空间离散化给出了空间网格上的黎曼和;利用齐次性假设,允许使用共享卷积算子结合MLP来建模局部非线性能量密度;输出的平方保证了非负的局部能量贡献。在下文中,我们将 \(H_{\theta,\theta_{nl}}\) 和 \(\theta\) 的组合称为StringPHNN。
参见图注
图1:网络 \(H_{\theta_{nl}}\) 包含一个核大小为2的卷积层和一个具有5个隐藏层(每层100个单元)及LeakyReLU激活函数的MLP。
表2:数据集生成参数。
## 4. 数值实验
### A. 问题陈述
给定一个离散参考轨迹 \(\mathcal{T}\),目标是设计一个PHNN模型,使其能够准确生成一个尽可能逼近 \(\mathcal{T}\) 的轨迹 \(\tilde{\mathcal{T}}\)。使用改进的SAV方法要求用交错网格[17 (https://arxiv.org/html/2605.12785#bib.bib19)]在时间上离散轨迹,使得 \(\mathcal{T} = \{\mathbf{q}_{s}^{t-1/2}, \mathbf{p}_{s}^{t}, f_{e}^{t+1/2}, x_{e}\}\),其中 \(s \in \{1, \cdots, N-1\}\),\(t \in \{0, \cdots, T_{s}/dt\}\)。
参见图注
图2:时间交错方案表示,其中变量定义在偏移时刻。
### B. 实现细节
#### i. 数据生成
我们考虑一个非线性弦,其固定配置详见表2 (https://arxiv.org/html/2605.12785#S3.T2),这保证了我们选择的采样频率 \(f_s = 88.2\,\text{kHz}\) 下的数值稳定性。关于如何选择这些参数的更详细解释见Risse等人[28 (https://arxiv.org/html/2605.12785#bib.bib72)]。数据生成过程与Zhelenov等人[34 (https://arxiv.org/html/2605.12785#bib.bib74)]中详述的类似。用于生成训练、验证和测试数据集的仿真参数列于表2 (https://arxiv.org/html/2605.12785#S3.T2),其中 \(N_{\text{traj}}\) 是轨迹数量,\(T_s\) 是仿真持续时间。每条轨迹包含每个节点 \(s\) 的位移 \(q_s\) 和动量 \(p_s\) 信息。物理参数对应基频 \(f_0 \approx 55.5\,\text{Hz}\)。该弦由随机生成的激励函数 \(f_e(t)\) 在随机选择的激励位置 \(x_e\) 处根据指定参数范围内的均匀分布进行激励。
#### ii. 训练与测试细节
基线模型由一个MLP组成,其输出...相似文章
基于物理建模的神经网络
本文介绍了动力学物理建模神经网络(DynPMNNs),这是一种连续时间深度学习架构,其中隐藏层由常微分方程定义。该方法基于再生核巴拿赫空间,具有生物启发性,在加州房屋数据集上展现出与标准神经ODE相当的性能,且参数更少。
扩散Fitzhugh-Nagumo模型中的均衡传播与哈密顿推断
本文将均衡传播扩展到斜梯度系统,并展示了深度能量模型与哈密顿神经网络之间的等价性,重点关注扩散耦合的Fitzhugh-Nagumo神经元。它还推导了此类网络中用于推理的逐层哈密顿递归关系。
用于$\textit{Norne}$油藏系统的连续物理约束神经算子正向建模
本文提出了一个全面的数学框架,用于使用傅里叶神经算子(FNO)及其物理信息变体(PINO)对三相黑油油藏动态进行连续代理建模,并应用于Norne基准油藏。理论贡献包括泛函分析公式、协变量偏移分析、物理约束谱稳定性以及截断反向传播梯度分析。
深度学习的哈密顿-雅可比理论
本文识别神经网络训练为通过哈密顿-雅可比初值问题的搜索,表明残差网络、Transformer和RNN离散化了同一类粘性哈密顿-雅可比方程。推导出定量结果,包括极小极大最优泛化率、对抗鲁棒性界和闭式影响函数。
具有可学习损失平衡和迁移学习的物理信息神经网络
本文提出了一种自监督物理信息神经网络(PINN)框架,该框架通过可学习的混合神经元自适应地平衡基于物理和数据驱动的损失,并结合迁移学习以提高数据稀缺情况下的效率。该框架在仅有87个数据点的液态金属微型散热器CFD数据上进行了验证,误差低于8%。