物理信息卷积神经网络用于多孔介质流体流动

arXiv cs.LG 2026/05/21 04:00 论文

摘要

本文提出了一种物理信息卷积编码器-解码器网络，用于从多孔介质几何结构预测孔隙尺度速度场，并证明使用网络预测初始化格子玻尔兹曼模拟可在超过90%的情况下加速收敛。

arXiv:2605.20250v1 公告类型：新提交摘要：多孔介质中流体流动的精确模拟因孔隙空间几何结构复杂以及求解纳维-斯托克斯方程的计算成本而具有挑战性。当需要进行重复模拟时，这一困难尤为重要，因为标准数值求解器在复杂的多孔区域中可能收敛缓慢。我们提出了一种基于神经网络的框架，直接从样本几何结构预测孔隙尺度速度场。该方法采用带有跳跃连接的卷积编码器-解码器架构，在提取多尺度特征的同时保留空间细节。通过结合速度重建与不可压缩性、固体内部无流动条件、周期性约束以及全局迂曲度指数一致性的自定义损失函数，鼓励物理一致性。我们分析了相应损失权重的影响，并量化了各个损失分量对预测精度的贡献。评估了多个CNN骨干网络，以识别能够提供准确且稳健预测的架构。在训练分布之外的样本上测试了训练模型的泛化能力，包括障碍物几何结构、边界条件、孔隙度以及真实多孔结构的变化。最后，我们展示了将预测速度场作为格子玻尔兹曼模拟初始条件的实际应用。这种热启动策略加速了求解器收敛，在超过90%的测试案例中减少了迭代次数。

查看原文

查看缓存全文

缓存时间: 2026/05/21 06:20

# 物理信息卷积神经网络用于多孔介质流体流动 来源：https://arxiv.org/html/2605.20250 ###### 摘要 由于孔隙空间几何结构的复杂性以及求解纳维-斯托克斯方程的高计算成本，准确模拟多孔介质中的流体流动是一项具有挑战性的任务。传统的数值求解器依赖于精心构建的网格，通常需要人工干预，且收敛速度较慢。这一问题在多孔介质中尤为突出，因为动量输运的扩散性质受到复杂固体边界的阻碍。这些挑战限制了数值模拟的效率，尤其在需要重复评估的场景下。我们提出了一种基于神经网络的框架，用于直接从样本几何结构预测孔隙尺度的速度场。该方法基于带有跳跃连接的卷积编码器-解码器架构，旨在保留精细的结构信息。通过一个由多个项组成的自定义损失函数来增强物理一致性：不可压缩性、固体内部无流动条件、周期性约束以及与全局曲折度指数的一致性。我们系统分析了这些损失项权重选择的影响，定量评估了它们各自对预测准确性的贡献。我们评估了多种受计算机视觉启发的架构变体，以确定表现最佳且最稳健的模型。在训练分布之外的样本上评估了训练网络的泛化能力，包括边界条件、障碍物几何形状和孔隙率的变化。最后，我们展示了网络预测的额外实际应用：将网络预测结果用作格子玻尔兹曼方法（LBM）模拟的初始化值。LBM是一种标准流体动力学求解器，常用于多孔介质等复杂边界问题，我们用它来训练网络。我们以网络生成的速度场作为起点，发现这显著加速了LBM求解器的收敛，在超过90%的情况下实现了改进。 ###### 关键词：物理信息神经网络，孔隙尺度速度预测，卷积编码器-解码器网络，模型泛化，流体流动，多孔介质，曲折度与渗透率，格子玻尔兹曼方法 ††期刊:Scientific Reports\\affiliation organization=拓扑数据分析迪奥库里中心，波兰科学院数学研究所，地址：ul. Śniadeckich 8，邮编：00-656，城市：华沙，国家：波兰\\affiliationorganization=实验物理研究所，物理与天文学学院，弗罗茨瓦夫大学，地址：pl. M. Borna 9，邮编：50-204，城市：弗罗茨瓦夫，国家：波兰 \\affiliation organization=拓扑数据分析迪奥库里中心，波兰科学院数学研究所，地址：ul. Śniadeckich 8，邮编：00-656，城市：华沙，国家：波兰 \\affiliation organization=理论物理研究所，物理与天文学学院，弗罗茨瓦夫大学，地址：pl. M. Borna 9，城市：弗罗茨瓦夫，邮编：50-204，国家：波兰\\affiliationorganization=并行与分布式系统实验室，Jožef Stefan研究所，地址：Jamova cesta 39，城市：卢布尔雅那，邮编：1000，国家：斯洛文尼亚\\affiliationorganization=\*通讯作者：[email protected] (Maciej Matyka) ## 1 引言 多孔材料在自然界和技术中无处不在。对它们的研究涉及与流体输运、力学和强度相关的广泛课题。其中一个具有特定应用价值的领域是多孔样品渗透率的研究，该研究在石油开采（Zhong 等人，2021 (https://arxiv.org/html/2605.20250#bib.bib37)）、CO2封存（Cossins 等人，2023 (https://arxiv.org/html/2605.20250#bib.bib3)）以及医学中都有应用，一个突出的例子是将血脑屏障作为药物输送路径，其渗透率常受到关注（Fong，2015 (https://arxiv.org/html/2605.20250#bib.bib6)）。在过去的几十年里，求解流体输运问题需要使用先进的数值方法来求解纳维-斯托克斯方程（Anderson，2002 (https://arxiv.org/html/2605.20250#bib.bib2)）。标准计算流体动力学模拟流程中主要耗费时间的环节包括：求解大型线性方程组、创建计算网格、使用高性能计算机，以及动量输运的扩散性质。通常，给定边界条件、初始条件和物理参数，求解水中粒子轨迹的唯一方法是采用近似、数值和迭代的方法来求解非线性纳维-斯托克斯方程。使用介观格子玻尔兹曼方法（Guo and Shu，2013 (https://arxiv.org/html/2605.20250#bib.bib12)）——在规则网格上处理粒子分布函数的输运——是一种有前景且成功的方法，特别适用于不规则和多孔几何结构（Succi，2001 (https://arxiv.org/html/2605.20250#bib.bib32)）。然而，这带来了额外的物理复杂性（在解释上）以及额外的内存和时间需求，因此需要特殊的优化（Lehmann 等人，2022 (https://arxiv.org/html/2605.20250#bib.bib22)）和用于处理大型数据集的内存布局（Tomczak and Szafran，2019 (https://arxiv.org/html/2605.20250#bib.bib34)）。 与此同时，我们（人类）通过观察物理系统来学习。看到抛向天空的球，我们知道它最终会落下，我们自然地做到这一点，而并不了解背后的偏微分方程。类似地，对于有障碍物的开放通道中的流体流动，我们大约知道水会流向哪里、如何转向，以及在什么条件下可能形成涡流。直觉上，涡流主导的流动发生在速度增加的条件下，我们能够根据知识和先前的观察进行预测。 近年来的研究表明，使用人工智能和深度卷积神经网络也可以实现这一点。Guo 等人展示了利用卷积神经网络（CNN）预测通道中单个障碍物绕流的稳态流动（Guo 等人，2016 (https://arxiv.org/html/2605.20250#bib.bib11)）。最近，同一组作者展示了通道中单个障碍物周围非定常流动的预测（Guo 等人，2024 (https://arxiv.org/html/2605.20250#bib.bib10)）。然而，我们的目标是预测复杂多孔介质几何结构中的流动，无论是在低孔隙率还是高孔隙率下，其中孔隙网络的复杂性对神经网络构成了挑战。在我们最近的工作中，我们已经证明，仅凭几何信息就足以预测多孔样品的物理性质，从而使用 CNN 预测其在流体流动和扩散过程中的宏观性质（Graczyk and Matyka，2020 (https://arxiv.org/html/2605.20250#bib.bib8)）；Graczyk 等人，2023 (https://arxiv.org/html/2605.20250#bib.bib9)）。关于使用深度学习技术预测物理样品物理性质的研究记录非常丰富。最近，Lin 等人研究了 CNN 在预测金属泡沫样品中速度和温度分布方面的应用，展示了该方法相比标准数值程序的高效性（Lin 等人，2025 (https://arxiv.org/html/2605.20250#bib.bib24)）。研究表明，通过结合物理信息网络来再现温度场，可以改进 CNN 对物理场的预测（Zhao 等人，2023 (https://arxiv.org/html/2605.20250#bib.bib36)），这一过程等效于求解微分方程，并有助于生成物理正确的结果。 我们的工作提出了一种结合物理信息的 CNN 方法，用于处理不同孔隙率条件下的复杂多孔介质中的流体流动。我们使用卷积神经网络和一个定制的、物理驱动的损失函数。我们在基于 CNN 的孔隙尺度流动预测方面的主要贡献总结如下： - 1) 我们实现了一个完整的流程：从构建多孔样品、使用格子玻尔兹曼方法进行模拟，到训练 CNN 以预测不同孔隙率下多孔介质流体流动中的速度场。 - 2) 我们构建并评估了一个针对孔隙尺度流动预测定制的损失函数，包括与计算网格周期性和曲折度匹配相关的项。 - 3) 我们对不同类型多孔介质样品进行了测试，以展示神经网络的泛化能力，并能够预测超出网络学习数据区域的情况。 - 4) 我们展示了 CNN 在格子玻尔兹曼方法中的实际应用：如果使用神经网络的预测来初始化流体动力学求解器，LBM 求解器可以得到显著加速。 我们注意到，将 CNN 用作替代模型以及将物理启发约束纳入神经网络训练的想法已经成熟。因此，本工作的贡献并非引入新的学习范式，而是为孔隙尺度流动预测制定并评估一个针对特定问题的物理信息损失函数，同时对其组成部分、架构依赖性、分布外行为以及用于 LBM 初始化进行系统评估。 本文的组织结构如下：在第2节 (https://arxiv.org/html/2605.20250#S2) 中，我们介绍了多孔介质的物理模型，并讨论了流体流动求解器——格子玻尔兹曼方法，该方法随后用于准备训练速度场。我们描述了合成本文所研究的多孔介质模型的步骤。此外，详细描述了学习过程，包括数据增强和损失函数的详细说明。我们讨论了神经网络架构的选择和分析，并描述了训练协议的细节。在结果部分 (https://arxiv.org/html/2605.20250#Sx1) 中，我们展示了训练网络对样品曲折度和渗透率的预测结果。然后，我们讨论并展示了我们方法在泛化方面的性能，包括推广到其他孔隙率、障碍物形状和边界条件的能力。我们在第3节 (https://arxiv.org/html/2605.20250#S3) 中总结了我们的发现。 ## 2 材料与方法 ### 孔隙尺度流动 我们在孔隙尺度上描述多孔样品，其中随机分布的固体障碍物填充空间直至达到样品的期望孔隙率。我们假设两个方向均为周期边界条件，在二维情况下，这直接表示环面拓扑上的多孔介质。流动由重力驱动，重力将流体加速到一定程度。由于无滑移边界条件，系统稳定到所谓的定常流动。 孔隙中流体流动的控制方程是纳维-斯托克斯方程，对于不可压缩流体，其形式为： ∇·u = 0, (1) ρ(u·∇u) = -∇p + μ∇²u + f, (2) 其中 u 是速度，μ 是动力粘度，p 是压力，ρ 是密度。在这里，我们工作在低雷诺数范围内，此时通过多孔基质的流动满足更简单的达西线性定律： q = - (k/μ)(∇P + ρf), (3) 其中 q 是达西通量，k 是渗透率 [L²]，f 是外力密度（即重力）。渗透率 k 在应用和多孔介质研究中至关重要。它已成为一个标准度量，并具有描述性的实验处理协议。在实际应用中，它可以用曲折度和孔隙率表示，即： k = φ³ / (c τ² S), (4) 其中 c 是材料特定常数，τ 是介质的曲折度，S 是孔隙的比表面积（Koponen 等人，1997 (https://arxiv.org/html/2605.20250#bib.bib19)）。这种渗透率的定义允许基于介质的几何性质进行估算，但 τ 的值除外，它必须在模拟或实验中测量。曲折度是一个无量纲数，代表由于固体基质的存在而导致的多孔介质孔隙的伸长，它由孔隙空间几何结构和通道形成的物理过程决定。可以利用在速度场上生成的流线来研究，这些流线的平均伸长可用于计算曲折度指数（Koponen 等人，1996 (https://arxiv.org/html/2605.20250#bib.bib18)）；Matyka 等人，2008 (https://arxiv.org/html/2605.20250#bib.bib26)）。我们将使用速度场，通过在孔隙空间中对流向动量和总动量进行积分来计算曲折度，从而得到以下曲折度表达式： τ = ⟨v⟩ / ⟨v_x⟩, (5) 其中尖括号表示在孔隙空间上的平均值，x 是平行于外力方向的速度分量（Duda 等人，2011 (https://arxiv.org/html/2605.20250#bib.bib5)）；Matyka and Koza，2012 (https://arxiv.org/html/2605.20250#bib.bib27)）。 ### 格子玻尔兹曼方法 为了求解流动问题并获得孔隙空间速度场以训练神经网络，我们使用了一种间接的介观格子玻尔兹曼方法（LBM）。LBM 在具有九速度离散化的规则网格上工作。它通过求解粒子分布函数 f(x,t) 的输运方程间接求解纳维-斯托克斯流动方程，该分布函数表示在特定位置和时间找到具有给定速度的粒子的概率。该方法在多孔介质流动中展示了其独特的特性和准确性，主要因其实现简单以及能够使用局部无滑移边界条件处理复杂几何结构而广受欢迎。我们将利用其特性，并使用以下 BGK（单松弛近似）碰撞项模型求解粒子分布函数的输运方程（Succi，2001 (https://arxiv.org/html/2605.20250#bib.bib32)）： f_i(x + e_i, t + δt) = f_i(x,t) + (f_i^eq(x,t) - f_i(x,t)) / τ, (6) 其中 τ 是松弛时间，f_i^eq 是平衡分布函数。计算输运分布函数的连续矩可得到宏观密度 ρ(x,t) 和速度 u(x,t) 场： ρ(x,t) = Σ_i f_i(x,t), (7) ρ(x,t) u(x,t) = Σ_i f_i(x,t) e_i, (8) 其中 e_i 是格子方向向量。 ### 多孔样品 二维多孔结构表示为分辨率为 256×256 像素的二元图像。这些结构通过叠加具有固定波长和振幅但不同随机方向 q_i 和相位 φ_i 的驻正弦波生成。生成的场由下式给出： f(x) = (2/N) Σ_{i=1}^{N} cos(q_i·x + φ_i), x ∈ [0,1]×[0,1], f(x) 在阈值处理后会生成二元图像。

物理信息卷积神经网络用于多孔介质流体流动

相似文章

基于物理引导的卷积神经网络用于守恒动力学系统中畴生长的预测

利用深度学习在无几何参数条件下预测微流控装置中的惯性升力

一种全GPU工作流：构建高超声速流动物理仿真器

面向物理系统群体动力学学习的双参数流

用于二维浅水方程的有限体积信息神经网络框架：崎岖的损失景观与数据指导的重要性

提交意见反馈