基于物理引导的卷积神经网络用于守恒动力学系统中畴生长的预测
摘要
提出了一种基于注意力机制的物理引导卷积神经网络作为代理模型,用于预测由Cahn-Hilliard方程支配的系统的微观结构演化,展示了稳定且准确的长期预测。
arXiv:2606.26128v1 Announce Type: new
摘要:许多物理、化学和生物系统的时空演化由非线性偏微分方程(PDEs)描述。近年来,基于深度神经网络的代理模型作为计算成本高昂的传统数值求解器的高效替代方案,引起了越来越多的关注。在这项工作中,我们提出了一种基于注意力机制的物理引导卷积神经网络作为代理模型,来学习此类系统的微观结构演化。我们训练该模型以准确预测由Cahn-Hilliard方程支配的二元混合物中相分离的完整时间演化。我们表明,训练后的代理模型的预测在长期推演中对于临界和非临界混合物均保持稳定和准确,并在整个演化过程中保持混合物的组成。我们还表明,我们的模型准确捕捉了畴尺寸的增长,并与Lifshitz-Slyozov畴生长定律一致。预测结果证明了所提出框架在模拟具有守恒动力学的系统方面的有效性,并且可以扩展到其他复杂动力系统。
查看缓存全文
缓存时间: 2026/06/26 05:14
# 物理引导的卷积神经网络用于具有守恒动力学的系统中畴生长预测 来源:https://arxiv.org/html/2606.26128 Vijay Yadav,Madhu Priya 印度,贾坎德邦,兰契,比拉理工学院梅斯拉校区物理系,邮编835215 Manish Dev Shrimali 印度,拉贾斯坦邦,阿杰梅尔,中央拉贾斯坦大学物理系,邮编305817 Prabhat K. Jaiswal([email protected]) 印度,拉贾斯坦邦,焦特布尔,印度理工学院焦特布尔分校物理系,邮编342030 ###### 摘要 许多物理、化学和生物系统的时空演化由非线性偏微分方程(PDEs)描述。近年来,基于深度神经网络的代理模型作为计算成本高昂的传统数值求解器的高效替代方案,引起了越来越多的关注。在本工作中,我们提出了一种基于注意力机制的物理引导卷积神经网络作为代理模型,用于学习此类系统的微观结构演化。我们训练该模型以准确预测由Cahn-Hilliard方程支配的二元混合物中相分离的完整时间演化。我们展示了训练后的代理模型在长时间滚动预测中,对于临界和非临界混合物均保持稳定且准确,并在整个演化过程中保持混合物成分不变。我们还展示了我们的模型能够准确捕捉畴尺寸的增长,并与Lifshitz-Slyozov畴生长定律一致。预测结果证明了所提出框架在建模具有守恒动力学的系统中的有效性,并可推广到其他复杂动力系统。 ††预印本:AIP/123-QED ## I 引言 非线性偏微分方程(PDEs)在建模和理解广泛科学与工程应用中的复杂动力系统方面发挥着基础性作用。Hohenberg and Halperin (1977); Evans (2010); Cahn and Hilliard (1958); Keller and Segel (1970); Hillen and Painter (2009)。例如,Navier-Stokes方程用于描述流体速度场的演化,Keller-Segel模型用于建模细胞响应化学信号的集体运动和聚集(Keller and Segel 1970)。在大多数情况下,获得这些非线性PDEs的解析解极具挑战,且常常是不可能的(Geng et al. 2024)。因此,开发高效且精确的数值方法用于近似其解,对于模拟和理解其动力学变得至关重要。常用的数值技术依赖于空间和时间离散化,包括有限差分、有限元和谱方法。然而,这些技术通常需要复杂的网格划分和大规模稀疏系统的迭代求解,导致计算成本高昂且在当代并行架构上可扩展性有限(Chen et al. 2021; Sun et al. 2020; Dwivedi and Srinivasan 2020)。 近年来,机器学习在PDEs研究中得到了广泛探索,大致可分为两类:(i) 求解PDEs和(ii) 从数据中发现未知PDEs。2019年,Raissi等人引入了物理信息神经网络(PINNs),在第一类中取得了显著成功(Raissi et al. 2019)。在标准PINN框架中,包括控制方程、边界条件和初始条件在内的物理先验知识被明确嵌入到训练过程中(Raissi et al. 2019; Karniadakis et al. 2021; Chen et al. 2021)。核心思想是将PDE残差作为神经网络损失函数的一部分,在训练过程中通过最小化该损失函数来强制满足物理一致性。第二类包括数据驱动的代理模型和算子学习模型,例如卷积神经网络(CNNs)(Bhatnagar et al. 2019; Kim et al. 2019; Zhu et al. 2019)、循环神经网络(RNNs)(Montes de Oca Zapiain et al. 2021; Srinivasan et al. 2019; Gajamannage et al. 2023; Wiewel et al. 2019)和神经算子(NOs)(Lu et al. 2021; Li et al. 2021; Diab and Al Kobaisi 2025; Fang et al. 2025),这些模型直接从数据中学习系统的时空演化,而无需显式强制满足控制方程。 我们的工作聚焦于Cahn-Hilliard(CH)方程,这是一个四阶非线性PDE,描述了守恒序参量(通常是浓度场)的演化。它在模拟二元混合物、合金以及其他多相系统中的相分离和粗化现象中起着基础性作用。近年来,上述两类方法均被探索作为传统计算成本高昂的数值求解器的高效替代方案,用于学习CH动力学。然而,CH方程的解展现出若干特征,对PINNs和神经算子建模构成了挑战。四阶空间导数的存在增加了自动微分的复杂性,并常常导致优化过程中梯度传播不稳定(Wang et al. 2021a; Krishnapriyan et al. 2021)。此外,非线性自由能公式产生了尖锐的扩散界面和高频结构,而传统PINNs由于频谱偏差往往偏好平滑解(Wang et al. 2021b)。相分离动力学还涉及多个时间尺度,导致刚度问题,使训练和采样策略复杂化。另外,序参量守恒作为CH方程的内在属性,在标准PINN框架中并未得到自然强制实现,这可能导致物理上不一致的解。 已经提出了若干改进方法,包括守恒PINNs(cPINNs)(Jagtap et al. 2020)和自适应渐进推进PINNs(APM-PINNs)(Hu and Huang 2025),通过强制执行守恒定律并提高刚劲动力学的训练稳定性来缓解这些挑战(Qiumei et al. 2024; Geng et al. 2024; Kiyani et al. 2022; Geng et al. 2025; He et al. 2023; Mattey and Ghosh 2022)。与此同时,数据驱动方法(如循环神经网络RNNs)已被探索用于加速CH动力学的模拟(Montes de Oca Zapiain et al. 2021)。此外,我们近期的研究调查了现代机器学习架构,包括储层计算(RC)(Chauhan et al. 2023)和图神经网络(GNNs)(Yadav et al. 2025),以学习由CH方程支配的二元混合物中相分离的演化。然而,这些模型未能保持序参量的守恒,特别是在长期自回归滚动预测中,小的预测误差随时间累积。这导致守恒量逐渐损失,并产生物理上不一致的动力学行为,突显了需要在学习框架中显式强制守恒的同时,确保CH动力学在长时间内的稳定预测。 在本工作中,我们提出了一种基于注意力机制的物理引导卷积网络,这是一种用于建模具有守恒参数系统的数据驱动方法。所提出的模型受现代残差U-Net架构(Ronneberger et al. 2015; Jha et al. 2019)启发,并将守恒约束直接纳入损失函数中。此外,引入了注意力机制来捕捉演化微观结构中的全局模式。这些修改在保持演化过程中序参量守恒的同时,提高了长期滚动预测的准确性。我们通过评估与物理相关的量(包括生长定律、动态标度行为、序参量分布和守恒性质)来证明所提出模型的有效性,而非仅仅依赖于一对一场的预测精度。 本文组织如下。第II节回顾了二元混合物中相分离的相场建模,并描述了所提出的模型架构、数据集生成和训练过程。第III节展示了模型在训练和验证数据集上的评估,随后分析了其在捕捉临界和非临界混合物畴形态方面的性能,及其再现畴生长定律的能力。最后,第IV节给出了结论性意见。 ## II 方法 ### II.1 二元混合物中相分离的相场模型 我们考虑一个二元合金系统,其中流体动力学效应可忽略,因此动力学主要由扩散输运支配。该系统在相场框架内描述,使用一个依赖于时空的守恒序参量 \(\psi(\vec{r},t)\),它表示两种原子物种的局部密度差。具体地,序参量定义为 \[ \psi(\vec{r},t) = \rho_A(\vec{r},t) - \rho_B(\vec{r},t), \quad (1) \] 其中 \(\rho_\alpha(\vec{r},t)\) 表示物种 \(\alpha \in \{A,B\}\) 在位置 \(\vec{r}\) 和时间 \(t\) 处的局部数密度。\(\psi\) 的正值对应于富含物种 A 的区域,而负值表示富含 B 的区域。由于总原子数守恒,序参量也是一个守恒量。因此,随着相分离通过 A 和 B 原子的扩散进行,\(\psi\) 的演化必须满足局部守恒定律。序参量的时间演化因此由连续性方程支配 \[ \frac{\partial}{\partial t} \psi(\vec{r},t) = -\vec{\nabla} \cdot \vec{J}(\vec{r},t), \quad (2) \] 其中 \(\vec{J}(\vec{r},t)\) 表示与序参量输运相关的扩散流。由于流是由浓度波动引起的化学势梯度驱动的,假设其遵循如下线性唯象关系 \[ \vec{J}(\vec{r},t) = -D \vec{\nabla} \mu(\vec{r},t), \quad (3) \] 其中 \(D\) 是扩散系数,\(\mu(\vec{r},t)\) 表示局部化学势。化学势由亥姆霍兹自由能泛函 \(F[\psi]\) 对序参量的泛函导数给出 \[ \mu(\vec{r},t) = \frac{\delta F[\psi]}{\delta \psi(\vec{r},t)}. \quad (4) \] 在相场框架内,二元混合物的自由能泛函写为 \[
相似文章
物理信息卷积神经网络用于多孔介质流体流动
本文提出了一种物理信息卷积编码器-解码器网络,用于从多孔介质几何结构预测孔隙尺度速度场,并证明使用网络预测初始化格子玻尔兹曼模拟可在超过90%的情况下加速收敛。
神经算子的共形预测:物理模拟中的无分布不确定性量化
提出了将分裂共形预测首次应用于基于神经算子的物理模拟,提供了具有有限样本覆盖保证的无分布预测区间,并利用MC Dropout不确定性生成自适应宽度的区间。
利用深度学习在无几何参数条件下预测微流控装置中的惯性升力
本文提出了一种新颖的深度学习方法来预测微流控装置中的惯性升力,无需显式几何参数,与以前的模型相比,该方法能够更好地泛化到未见过的通道横截面。
基于物理建模的神经网络
本文介绍了动力学物理建模神经网络(DynPMNNs),这是一种连续时间深度学习架构,其中隐藏层由常微分方程定义。该方法基于再生核巴拿赫空间,具有生物启发性,在加州房屋数据集上展现出与标准神经ODE相当的性能,且参数更少。
基于空间相关性的物理信息神经网络课程学习
本文提出了一种基于空间相关性的物理信息神经网络(PINNs)课程学习框架,通过利用子区域间的空间相关性来提高训练稳定性和求解精度,解决了高维非凸损失景观和多目标约束不平衡等问题。