Physics-conforming Latent Twins

arXiv cs.LG 2026/06/16 04:00 论文

摘要

Physics-conforming Latent Twins 是一种用于学习潜在替代解算子的框架，通过约束转移方法和保持结构的潜在动力学，在设计中强制执行物理原理（如守恒定律和耗散不等式）。

arXiv:2606.15053v1 Announce Type: new 摘要：替代模型是科学机器学习的核心，能够为复杂物理系统实现快速预测、模拟、推理和控制。然而，对于时间相关问题，仅准确插值训练轨迹并不足够：可靠的替代模型还应尊重赋予轨迹物理意义的守恒律、不变量、可容许条件和耗散结构。我们提出了 Physics-conforming Latent Twins，这是一种学习潜在替代解算子的框架，其动力学通过设计满足选定的物理原理。该方法基于 Latent Twin 公式，通过联合学习编码器、解码器以及任意时间索引状态之间的潜在流映射，同时约束潜在动力学以保持或耗散指定的结构量。我们开发了一种约束转移视角，将原始状态空间中的物理结构与潜在空间中的兼容约束联系起来，并证明了结构保持界限，表明潜在约束如何改善解码后对物理缺陷的控制。我们还推导了用于保持线性和二次不变量或强制执行耗散不等式的潜在流映射的代数条件。在代表性 ODE 和 PDE 基准上的数值实验表明，该方法在保持准确替代预测的同时，改善了约束满足、结构保真度和定性长期行为。

查看原文

查看缓存全文

缓存时间: 2026/06/16 11:37

# 物理自洽潜在孪生

来源: https://arxiv.org/html/2606.15053 [1]

Matthias Chung \equalcont 这些作者对本文贡献相同。 \equalcont 这些作者对本文贡献相同。

[1]\orgdiv 数学系,\orgname 埃默里大学,\orgaddress \street 道曼大道400号,\city 亚特兰大,\postcode 30322,\state 佐治亚州,\country 美国

[2]\orgdiv 数学与统计科学学院,\orgname 克莱姆森大学,\orgaddress \street 公园大道220号,\city 克莱姆森,\postcode 29634,\state 南卡罗来纳州,\country 美国

###### 摘要

代理模型是科学机器学习的核心，能够对复杂物理系统进行快速预测、模拟、推理和控制。然而，对于时间相关问题，仅仅准确插值训练轨迹是不够的：可靠的代理还应尊重赋予这些轨迹物理意义的守恒律、不变量、可接受性条件和耗散结构。我们引入了物理自洽潜在孪生（Physics-conforming Latent Twins），这是一个学习潜在代理解算子的框架，其动力学由设计保留了选定的物理原理。该方法建立在潜在孪生（Latent Twin）框架之上，通过联合学习编码器、解码器以及任意时间索引状态之间的潜在流映射，同时约束潜在动力学以保留或耗散指定的结构量。我们发展了一种约束转移视角，将原始状态空间中的物理结构与潜在空间中兼容的约束联系起来，并证明了结构保持界限，表明潜在约束如何在解码后改善对物理缺陷的控制。我们还推导了潜在流映射的代数条件，以保留线性或二次不变量，或强制耗散不等式。在代表性ODE和PDE基准上的数值实验表明，在保持准确代理预测的同时，约束满足性、结构保真度和定性长期行为均得到改善。

###### 关键词: 科学机器学习; 物理信息学习; 潜在动力学; 结构保持代理建模; 自编码器; 降阶建模; 动力系统; 算子学习

## 1 引言

科学机器学习的承诺不仅仅是加速模拟，而是学习能够保留物理世界组织结构的模型。时间相关物理系统受制于输入-输出相关性之外：它们遵循守恒律，保留不变量，保持在可接受状态内，并常常反映潜在的对称性或几何结构。当学习的代理忽略这些原理时，它们可能很好地插值数据，但会失去使科学预测在外推、长时间模拟和其他下游应用中可靠的属性。这促使了一个核心问题：我们如何学习其动力学在设计上既准确、高效又具有物理意义的代理解算子？

在这项工作中，我们强调一种关于科学机器学习的结构感知视角：守恒、对称性、不变性、可接受性和耗散不仅仅是特定控制方程系统的结果；它们是潜在的构造性原则，限定了物理可接受演化的空间。从这个角度看，控制方程是更深层组织原则的表达，而不是物理结构的唯一来源。因此，我们寻求的代理模型不仅仅是模仿模拟轨迹：它们学习的动力学受到赋予这些轨迹物理意义的原理的限制。

这一观点与应用数学和物理学中的一个反复出现的主题一致：适当的表示可以揭示原始变量中隐藏的结构。诺特定理就是一个经典例子，它将守恒律识别为作用量的连续对称性的结果，而不是特定方程式的孤立性质\[noether1918invarianten,noether1983invariante\]。一个直接编码这种结构观点、约束其潜在动力学以尊重物理系统组织原则的代理模型，可以称为物理自洽（physics-conforming）的。

*物理自洽潜在孪生*通过将潜在空间不仅仅用于压缩，而是作为选定物理结构通过设计被编码和传播的空间来实现这一目标。*潜在孪生*框架在\[chung2026latent\]中引入，并联合学习（i）将高维状态映射到潜在表示的编码器-解码器，以及（ii）在任意时间 s,t 之间传播状态的潜在解算子。在此基础上，我们引入了满足选定物理原理（包括守恒律、二次不变量和耗散不等式）的结构化潜在流映射，从而实现物理自洽的代理动力学。这将我们的方法置于算子学习的视角下：我们不是学习单步更新或向量场，而是学习形式为 u(s)↦u(t) 的映射。潜在空间与动力学联合学习，使得得到的表示能够满足指定物理规律的代理演化。

在科学机器学习中开发的众多代理建模方法中，包括降阶模型、Koopman方法、神经算子、物理信息网络和潜在表示学习（在第2.1节（https://arxiv.org/html/2606.15053#S2.SS1）中回顾），这些方法在它们学习的数学对象以及物理结构施加方式上有所不同。在此格局中，物理自洽潜在孪生被定位为潜在解算子模型：核心对象是一个学习到的时间索引状态之间的潜在流映射，而不是投影微分方程、识别出的向量场或残差约束的解场。我们不将潜在空间视为快照的被动压缩，而是将学到的表示用作组织并约束代理演化的空间——物理结构不是在预测之后施加的辅助诊断，而是设计用于编码和保留所学解算子的一部分。

本研究的主要贡献是开发、分析并展示一个物理自洽潜在孪生的框架。我们将潜在孪生公式化为潜在代理解算子，其潜在流映射可以直接被约束，而不仅仅依赖物理变量中的惩罚或诊断。为了将物理约束与潜在动力学联系起来，我们引入了一种约束转移视角，将状态空间中的结构与潜在空间中兼容的结构联系起来。这产生了结构近似界限，表明规定物理约束的事后违反程度受潜在孪生近似误差控制，并且当同一约束在潜在空间中直接编码并强制执行时，估计更加精确。然后我们将框架特化为线性潜在流映射，推导出保留线性不变量、二次能量结构和耗散不等式的代数条件。最后，我们通过ODE和PDE实验展示该框架，测试重建、潜在演化、约束保持和长时间行为，包括稳定的线性系统、具有守恒或能量结构的非线性动力学以及展示耗散行为的热方程基准。

本文的其余部分组织如下。在第2节（https://arxiv.org/html/2606.15053#S2）中，我们将物理自洽潜在孪生与相关代理建模方法进行定位，形式化潜在孪生解算子框架，并引入用于守恒、可接受性和耗散的结构泛函；这些主题分别在第2.1节（https://arxiv.org/html/2606.15053#S2.SS1）、第2.2节（https://arxiv.org/html/2606.15053#S2.SS2）和第2.3节（https://arxiv.org/html/2606.15053#S2.SS3）中展开。在第3节（https://arxiv.org/html/2606.15053#S3）中，我们推导了近似和结构保持结果，包括第3.1节（https://arxiv.org/html/2606.15053#S3.SS1）中事后结构缺陷的控制和第3.2节（https://arxiv.org/html/2606.15053#S3.SS2）中当约束在潜在空间强制时更精确的先验界限。我们还在第3.3节（https://arxiv.org/html/2606.15053#S3.SS3）中引入了物理自洽潜在流，并讨论了线性不变量、二次不变量和耗散结构的代数实现。第4节（https://arxiv.org/html/2606.15053#S4）中的数值实验在ODE基准和PDE例子上展示了所提出的框架，分别在第4.2节（https://arxiv.org/html/2606.15053#S4.SS2）和第4.3节（https://arxiv.org/html/2606.15053#S4.SS3）中讨论。我们在第5节（https://arxiv.org/html/2606.15053#S5）中通过讨论局限性及未来方向得出结论。

## 2 背景

本节建立将物理自洽潜在孪生公式化为结构感知代理解算子所需的背景。我们首先将该框架与科学机器学习中的相关方法进行定位，强调学习投影方程、残差约束解、向量场和潜在解映射之间的区别。然后我们回顾潜在孪生公式并固定编码器、解码器和潜在流映射的符号。最后，我们引入结构泛函，在一个共同的数学框架内表示守恒、可接受性和耗散。这些要素提出了本文后续部分要解决的核心问题：状态空间中的物理结构如何通过约束潜在动力学来被表示、强制和控制。

### 2.1 与代理建模方法的定位

科学机器学习已经产生了多种用于时间相关物理系统的代理建模方法，全面回顾超出了本工作的范围。与其尝试详尽调查，我们集中在与潜在孪生框架最密切相关的方法方向：降阶建模、基于Koopman的方法、神经算子、物理信息神经网络，以及用于科学动力学的潜在表示学习。这些方法共享用高效代理模型替代昂贵时间相关模拟的目标，但它们在选择学习的数学对象上有所不同。

经典降阶建模从许多科学系统在或接近低维解流形上演化这一观察出发。基于投影的方法，如本征正交分解和缩减基方法，因此构建一个低维试验空间并在该空间内近似控制方程\[benner2015survey,hesthaven2016certified\]。这一视角对科学计算具有奠基意义：它表明当主导动力学自由度可以被识别时，高效的代理是可能的。

第二条工作线基于Koopman视角。Koopman方法不是直接降阶状态，而是将动力学提升到一个可观测量空间，在该空间中非线性演化至少形式上可以线性表示\[koopman1931hamiltonian,mezic2005spectral\]。动态模态分解及其变体从数据中提供了这一思想的实用有限维近似\[schmid2010dynamic,kutz2016dynamic\]。最近，Koopman自编码器使用神经网络学习潜在演化近似线性的坐标\[lusch2018deep,takeishi2017learning\]。这些方法通过将表示学习与可解释的线性潜在动力学联系起来推动了领域发展，但它们通常围绕学习坐标中的演化而非围绕物理自洽解算子来组织。

第三个相关方向是稀疏模型发现和系统辨识，其中最突出的是非线性动力学稀疏辨识（SINDy）框架\[brunton2016discovering\]。这些方法通过从预定义的候选函数库中选择少量活跃项来寻求显式控制方程，并有扩展到PDE、弱形式、隐式动力学、控制输入以及受约束或物理信息变体\[rudy2017data,schaeffer2017learning,kaheman2020sindy,reinbold2020using\]。物理自洽潜在孪生共享对可解释和结构化动力学的强调，但在所学数学对象上有所不同：我们不是识别显式向量场或微分方程，而是学习一个潜在解算子，其允许的演化受结构泛函约束。

第四个主要方向是物理信息学习。物理信息神经网络通过通常在配置点计算的残差损失，将已知微分方程直接纳入训练目标\[raissi2019physics,baez2024guaranteeing,patel2022thermodynamically\]。这些方法重塑了数据和控制方程的结合方式，特别是在观测稀疏或边界条件与初始条件已知的情况下。同时，物理结构通常以环境变量中的残差惩罚形式施加，而不是通过结构化的潜在演化算子。

相关的工作线将物理结构直接嵌入神经网络架构而不是作为惩罚。哈密顿神经网络\[greydanus2019hamiltonian\]通过学习标量哈密顿量并通过哈氏方程推导动力学来参数化向量场，从而通过构造保证精确的能量守恒。这种归纳偏置导致在保守系统（如二体问题和摆）上训练更快、泛化更好，并生成完全时间可逆的模型。虽然哈密顿神经网络在原始状态空间的向量场层面运行，但物理自洽潜在孪生追求一个互补的目标：在潜在解算子而非直接学习的动力学上强制类似的保守结构。

神经算子又迈出了一步，学习函数空间之间的映射。诸如DeepONet和傅里叶神经算子等架构学习与参数化微分方程或时间相关解图相关联的输入-输出映射\[lu2021learning,li2020fourier,kovachki2023neural\]。这种算子学习视角极具影响力，因为它将注意力从学习单个解转移到学习在输入族上泛化的解映射。我们的工作采纳了这种解映射视角，但探讨如何能在潜在坐标中表示这些映射，使得物理结构可以直接施加于学习到的演化上。

最后，最近的表示学习方法将潜在变量与学习的动力学、算子映射或基于坐标的函数表示结合起来。这些方法探讨高维科学状态能否在紧凑坐标中表示，从而更容易进行预测。潜在空间动力学辨识方法，如LaSDI及其变体，使用自编码器压缩PDE解数据，然后在潜在空间中学习降阶动力学\[fries2022lasdi,he2023glasdi,tran2024weak,park2024tlasdi\]。相关的神经场方法使用基于坐标的解码器或隐式神经表示将状态表示为连续函数

Physics-conforming Latent Twins

相似文章

利用主动学习构建集成热能系统的基于物理的数字孪生

面向半导体制造的物理信息生成式人工智能：通过构造方式强制执行生成模型中的硬物理约束

神经算子的共形预测：物理模拟中的无分布不确定性量化

具有可学习损失平衡和迁移学习的物理信息神经网络

两步物理：在视觉细化之前锁定运动先验以防止其被抹除

提交意见反馈