(HB-ARFM) 历史引导的逆向沸腾重构流匹配方法
摘要
本文提出了一种历史引导的自回归流匹配方法,用于从沸腾动力学部分观测中重构完整的时空场(速度和温度),解决了非马尔可夫后验下的不适定逆问题。
arXiv:2606.00349v1 Announce Type: new
摘要:从部分观测中重构时空场是科学推理的基础,从卫星数据推断大气状态到从成像中恢复流体状态均体现了这一点。当观测不完整时,逆问题本质上是病态的:即使底层 PDE 动力学在全状态上是马尔可夫的,部分观测算子会导致非马尔可夫后验,该后验无法从单个时间步中求解。我们提出了一种用于部分可观测性下时空逆重构的历史引导自回归流匹配方法(HB-ARFM)。观测历史通过条件流匹配引导初始重构,减少了歧义。然后,相同的条件传输模型以自回归方式应用,同时以新观测和过去预测为条件,将重构向前传播到时间上。我们评估了该方法在沸腾动力学重构中的表现,从界面几何和运动恢复了完整的速度场和温度场。在两个观测稀疏程度不同的逆任务中,HB-ARFM 生成了物理和时间上有效的重构,而其他模型则失败。
查看缓存全文
缓存时间: 2026/06/02 15:41
# 历史引导的流匹配用于沸腾逆重建 来源:https://arxiv.org/html/2606.00349 ###### 摘要 从部分观测中重建时空场是科学推断的基础,从卫星数据推断大气状态到从成像恢复流体状态均属此类。当观测不完整时,逆问题本质上是病态的:即使底层偏微分方程动力学在全状态上是马尔可夫的,部分观测算子也会诱导出非马尔可夫的后验,无法从单个时间步中解出。我们提出了一种历史引导的自回归流匹配(HB-ARFM)方法,用于部分可观测条件下的时空逆重建。观测历史通过条件流匹配引导初始重建,从而减少歧义。然后,同一条件传输模型被自回归地应用,同时基于新观测和过去预测进行条件化,以将重建向前传播。我们在沸腾动力学重建任务上评估了该方法,从界面几何和运动中恢复完整的速度和温度场。在两个不同观测稀疏度的逆任务中,HB-ARFM 生成了其他模型无法实现的物理和时间一致的重建。时空重建、流匹配、自回归模型、科学机器学习、两相冷却、沸腾
## 1 引言
两相沸腾是已知最高效的传热形式。它在能源系统和热管理中发挥着核心作用,具有广泛的实际应用,包括数据中心冷却(Azarifar 等,2024 (https://arxiv.org/html/2606.00349#bib.bib32))、发电(Dirker 等,2019 (https://arxiv.org/html/2606.00349#bib.bib31))、可再生能源(Ni 等,2024 (https://arxiv.org/html/2606.00349#bib.bib49))以及太空热系统(Sielaff 等,2022 (https://arxiv.org/html/2606.00349#bib.bib50))。很少有科学挑战具有如此广泛的工业和社会影响,然而沸腾仍然以其难以实验表征而闻名。许多控制两相流性能的量,如温度和速度、相间质量传递以及界面热通量,要么不可观测,要么在原位测量中极具挑战性,特别是在快速演化的液-汽界面附近。因此,我们目前对沸腾的理解很大程度上依赖于数值模拟(Dhir 等,2013 (https://arxiv.org/html/2606.00349#bib.bib34))和相关性研究(Bertsch 等,2009 (https://arxiv.org/html/2606.00349#bib.bib35)),尽管高速视频成像数据已经存在了几十年(Gaertner,1965 (https://arxiv.org/html/2606.00349#bib.bib33);Seong 等,2023 (https://arxiv.org/html/2606.00349#bib.bib36);Suh 等,2024 (https://arxiv.org/html/2606.00349#bib.bib42))。先前基于学习的沸腾和多相流方法主要关注从完全观测模拟中进行正向预测或代理建模,包括神经算子和监督回归框架(Hassan 等,2023 (https://arxiv.org/html/2606.00349#bib.bib24),2025 (https://arxiv.org/html/2606.00349#bib.bib15);Khodakarami 等,2025b (https://arxiv.org/html/2606.00349#bib.bib28))。这一差距引出了一个经典的逆问题:从稀疏的、图像衍生的界面几何和运动观测中重建沸腾流的完整热流体状态。虽然两相流的控制方程在全状态上是马尔可夫的(Prosperetti 和 Tryggvason,2009 (https://arxiv.org/html/2606.00349#bib.bib45)),但由实验可观测性引发的逆问题并非如此。部分观测不能唯一确定隐藏的速度和温度场,单个时间步的测量不足以施加一致重建所需的时间和物理约束。迄今为止,仅从成像中完整重建沸腾时空场仍然是一个很大程度上未探索的领域。
参考图注图 1: 从高速成像进行时空沸腾动力学重建的示例流程。高速连续图像通过分割和光流处理,提取相场和界面速度。这些提取的观测值作为我们提出的 HB-ARFM 模型的条件,该模型随后输出速度和温度场的完整时空预测,从而仅从原始成像数据实现完整的多相流体动力学重建。
近年来生成建模的进展,特别是扩散模型(Ho 等,2020 (https://arxiv.org/html/2606.00349#bib.bib10);Song 等,2021 (https://arxiv.org/html/2606.00349#bib.bib11))和流匹配(Lipman 等,2023 (https://arxiv.org/html/2606.00349#bib.bib13)),在高维 PDE 逆问题中展示了显著的成功(Holzschuh 等,2023 (https://arxiv.org/html/2606.00349#bib.bib5);Huang 等,2024 (https://arxiv.org/html/2606.00349#bib.bib4);Jacobsen 等,2025 (https://arxiv.org/html/2606.00349#bib.bib3);Yao 等,2025 (https://arxiv.org/html/2606.00349#bib.bib6))。然而,这些方法通常针对快照或静态重建,产生违反时间一致性的重建。扩展到视频和时空数据的工作主要集中于联合时空逆建模(Li 等,2024 (https://arxiv.org/html/2606.00349#bib.bib19))或正向预测:给定完整的过去观测生成未来帧(Jin 等,2025 (https://arxiv.org/html/2606.00349#bib.bib14);Gao 等,2025 (https://arxiv.org/html/2606.00349#bib.bib46))。当适应于逆问题时,这类自回归模型会遇到冷启动问题,因为缺乏真实初始条件。这些局限性并非沸腾所特有,但由于尖锐的界面、多物理场耦合以及对隐藏输运过程的强敏感性,沸腾提供了一个特别严格的测试。在本工作中,我们通过利用时间历史来引导初始状态并减少逆问题歧义来应对这一挑战。我们做出以下核心贡献:
1. **用于时空逆问题的历史引导自回归流匹配。** 我们提出一个统一的逆重建模型,通过使用观测历史初始化潜在状态,减少由部分可观测性引起的内在非马尔可夫性,随后在单一流匹配框架内进行条件自回归传播。
2. **首次从成像衍生观测中重建完整沸腾热流体场。** 我们首次展示了仅使用界面几何和运动(见图 1 (https://arxiv.org/html/2606.00349#S1.F1))对多相沸腾流中完整速度和温度场进行时空重建,显著提高了部分观测下的物理一致性和热通量估计。
3. **作为逆 SciML 模型压力测试的沸腾及失效模式识别。** 通过两个难度不同的逆重建任务,我们系统地揭示了现有生成模型、自回归模型和物理信息模型在存在移动界面、多物理场耦合和部分可观测性时的失效模式,将沸腾确立为科学机器学习中逆建模的一个具有挑战性的基准。
## 2 问题公式化
我们考虑一个由偏微分方程控制的时空系统:
∂tX(t,x)=F(X(t,⋅))(x),x∈Ω⊂Rd, (1)
其中 X(t,⋅):Ω→Rp 表示系统在时间 t∈[0,T] 的完整物理状态。我们通过一个部分且可能带噪声的测量算子 H 来观测系统:
y(t)=H(X(t,⋅))+ε(t). (2)
#### 部分可观测性下的逆重建。
给定观测 {y(t)}t=0T,我们的目标是重建时空动力学 {X(t)}t=0T。这个逆问题是病态的:当 H 不可逆时,多个状态 X(t) 与同一观测 y(t) 一致,特别是对于测量中缺失的量。在多相流体动力学中,仅靠界面几何不能唯一确定整体速度和温度场。部分可观测性导致了一个不对称性,其理论基础是 Mori-Zwanzig (MZ) 形式(Mori,1965 (https://arxiv.org/html/2606.00349#bib.bib58);Zwanzig,1973 (https://arxiv.org/html/2606.00349#bib.bib59))。当全状态 X(t) 投影到可观测子空间 y(t)=H(X(t)) 上时,MZ 理论指出 y(t) 的有效动力学呈现广义朗之万方程的形式,包含一个马尔可夫项、一个非局部记忆核和一个正交涨落项。只要存在隐藏变量(即当 H 不可逆时),记忆核就非零,使得逆后验是非马尔可夫的。瞬时观测缺乏恢复未观测自由度影响所需的足够信息,使得重建本质上具有歧义。标准的自回归模型假设能够访问完整的马尔可夫状态来条件化前一个状态 X(t−1)(Li 等,2022 (https://arxiv.org/html/2606.00349#bib.bib51)),而这正是我们试图重建的。相反,从 y(t) 独立重建每一帧的方法忽略了由控制动力学引起的时间结构(Huang 等,2024 (https://arxiv.org/html/2606.00349#bib.bib4)),并且在 MZ 意义上完全丢弃了记忆核。
**挑战。** 我们寻求的重建 X^ 应满足:(1)观测一致性:H(X^(t))≈y(t);(2)物理合理性:保持控制方程的结构;(3)时间连贯性:表现出平滑和稳定的演化;(4)长时间展开:随时间保持稳健的重建。困难在于平衡这些目标:在初始化时,没有先前的状态估计可用于传播;在时间演化过程中,我们必须避免观测漂移和误差积累。
## 3 方法:历史引导的 ARFM
我们研究从部分观测 yt∈Rm 重建潜在物理状态 Xt∈Rd 的逆问题。在单个时间步上,映射 yt↦Xt 是不可逆的,因为多个物理状态可能具有相同的部分可观测值。一个关键观察是时间历史可以减少这种歧义。虽然单个观测是不确定的,但历史 y0:t−1 通过隐含的物理动力学约束了允许的状态。然而,在每个时间步都条件化于完整历史是低效且不必要的,一旦形成了连贯的潜在状态估计。这激发了一个两阶段方法,如图 2 (https://arxiv.org/html/2606.00349#S3.F2) 所示:(i)一个历史条件引导重建,仅使用观测推断第一个隐藏状态,接着(ii)自回归流匹配,利用模型自身的预测并结合新观测来向前传播解。我们的目标是统一建模,因此两个阶段都使用具有时变上下文的共享条件流匹配模型实现。附录 B (https://arxiv.org/html/2606.00349#A2) 总结了本节使用的符号。
参考图注图 2: 历史引导的 ARFM。该模型结合了一个处理时间序列的历史编码器和一个用于初始重建和自回归重建的 FM UNet。FM UNet 预测完整的时空场。绿色路径显示初始重建,而红色反馈回路使得能够进行带数据同化的序列重建。
### 3.1 历史条件引导重建
假设观测从 t=0 开始可用。给定长度为 w 的历史窗口,目标是重建时间 t=w 处的第一个潜在状态。一个时间编码器 ζφ 聚合观测历史为一个引导状态:X^w = ζφ(y0:w)。以 cw=[yw, X^w] 为条件,一个流匹配速度场 vθ(·, cw, s) 将来自参考高斯分布的样本传输到 Xw 的后验分布。这个历史条件重建为自回归展开提供了一个初始化。固定历史窗口 w 由记忆核的衰减速率证明。MZ 保证记忆在特征时间尺度上衰减,超过该尺度,过去观测对当前状态提供指数级减少的信息。在沸腾中,相关时间尺度由气泡上升时间和冷凝时间决定,两者都包含在固定窗口长度内。
算法 1 训练:历史引导的 ARFM
0: 数据集 D={ (X0:T, y0:T) },历史长度 w,展开长度 K
0: 速度网络 vθ,历史编码器 ζφ
1: while 未收敛 do
2: 采样轨迹 (X0:T, y0:T) ∼ D
3: 采样起始时间 t0 ∼ Uniform(w, T−K)
4: // 引导:从历史估计初始状态
5: X^t0 = ζφ(yt0−w:t0−1)
6: Lboot = ‖X^t0 − Xt0‖²
7: // 引导帧上的流匹配损失
8: 采样 x0 ∼ N(0,I), s∼U(0,1)
9: xs = (1−s)x0 + s Xt0
10: ct0 = [yt0, X^t0]
11: Lboot += ‖Xt0 − x0 − vθ(xs, ct0, s)‖²
12: // 自回归展开
13: Xctx = X^t0
14: for k=1 to K−1 do
15: 采样 x0 ∼ N(0,I), s∼U(0,1)
16: xs = (1−s)x0 + s Xt0+k
17: ct0+k = [yt0+k, Xctx]
18: LAR += ‖Xt0+k − x0 − vθ(xs, ct0+k, s)‖²
19: // 更新下一步的上下文
20: Xctx = Xt0+k
21: end for
22: L ← Lboot + LAR/(K−1)
23: 通过 ∇L 更新 θ, φ
24: end while
### 3.2 自回归序列重建
对于时间步 t>w,重建以自回归方式进行。在每个时间步,模型以当前观测和先前的预测潜在状态为条件:ct = [yt, X^t−1]。相似文章
Recursive Flow Matching
引入了 Recursive Flow Matching (RecFM),一种用于预测复杂时空动态的生成框架,以更少的步骤实现高保真度,并提高了准确性和速度,包括相比基于扩散的模拟器高达20倍的加速。
利用流匹配捕获非平衡随机系统中的非马尔可夫动力学
本文开发了一种生成式流匹配方法,用于捕获非平衡随机系统中的非马尔可夫动力学,并展示了与马尔可夫基线相比,在Kramers首次通过时间问题上的改进预测。
SDFlow:用于时间序列生成的相似性驱动流匹配
本文介绍了 SDFlow,这是一种用于时间序列生成的相似性驱动流匹配框架,旨在解决自回归模型中的暴露偏差问题。通过在冻结的 VQ 潜在空间中进行低秩流形分解,SDFlow 实现了最先进的性能并显著提升了推理速度。
基于最优传输势的多边缘流匹配
提出OTP-FM,一种新颖的多边缘流匹配方法,利用最优传输势来软性地引导流通过中间边缘分布,在单细胞RNA测序、海洋学和气象学数据集上实现了最先进的性能。
面向物理系统群体动力学学习的双参数流
提出了双参数流方法,从无标签样本学习高维概率密度的动力学,利用条件流匹配提取物理时间速度场。