用于全波形反演的扩散模型解耦潜在优化

arXiv cs.LG 2026/06/15 04:00 论文

摘要

介绍了用于全波形反演的解耦潜在优化（DLO），该方法将潜在优化松弛为一个二次罚目标，在基准测试中优于经典方法及基于扩散的方法，同时保留了平滑速度初始化的特性。

arXiv:2606.14139v1 公告类型：新摘要：全波形反演（FWI）通过求解一个严重不适定的非凸PDE约束优化问题，从地震记录中恢复地下速度。经典正则化方法能够稳定反演，但无法再现真实的地质结构；最近的基于扩散先验的方法提高了真实感，但代价是数据保真度与先验一致性之间的脆弱平衡。我们提出了解耦潜在优化（DLO），该方法将标准的潜在优化公式松弛为关于辅助物理变量和潜在变量的二次罚目标。数据保真度梯度在物理空间中作用，扩散采样器仅通过解码的先验样本贡献，并且保留了经典FWI的标准平滑速度初始化。在OpenFWI基准测试中，DLO在干净、有噪声和缺道采集条件下均优于经典正则化器和现有的基于扩散的方法。该先验在70×70的OpenFWI模型上训练，直接迁移到Marmousi和Overthrust基准测试，DLO在这些测试中恢复了复杂的断层结构，并对初始化平滑和测量噪声保持鲁棒性。

查看原文

查看缓存全文

缓存时间: 2026/06/15 09:10

# 用于全波形反演的扩散模型解耦潜在变量优化  
来源：https://arxiv.org/html/2606.14139  
Zheng Ma  
通讯作者。电子邮箱：[email protected]  
上海交通大学数学科学学院，上海，中国  
CMA-上海，上海交通大学，上海，中国  

###### 摘要  
全波形反演（FWI）通过求解一个严重不适定、非凸的PDE约束优化问题，从地震记录中恢复地下速度。经典正则化方法稳定了反演，但未能生成真实的地质结构；近年来，扩散先验方法提高了真实性，但代价是数据保真度与先验一致性之间脆弱的权衡。我们提出解耦潜在变量优化（DLO），它将标准的潜在变量优化形式松弛为一个关于辅助物理变量和潜在变量的二次惩罚目标。数据保真度梯度作用在物理空间中，扩散采样器仅通过解码的先验样本贡献，并保留了经典FWI的标准平滑速度初始化。在OpenFWI基准上，DLO在干净、噪声和缺道采集下均优于经典正则化方法和现有扩散方法。该先验在70×70 OpenFWI模型上训练，可直接迁移到Marmousi和Overthrust基准，DLO在这些基准上恢复了复杂的断层结构，并对初始化平滑和测量噪声保持鲁棒。  

**关键词：** 全波形反演；扩散模型；PDE控制的反问题；地震成像  

## 1 引言  
由偏微分方程（PDE）控制的反问题在科学与工程中扮演核心角色，涵盖医学成像、流体动力学和地球物理勘探[14 (https://arxiv.org/html/2606.14139#bib.bib27),47 (https://arxiv.org/html/2606.14139#bib.bib31)]。一个典型且特别具有挑战性的实例是地震反演，它广泛用于从地表采集的波场记录中重建定量的地下模型，并支持从资源勘探到地震危害评估和环境监测等应用[65 (https://arxiv.org/html/2606.14139#bib.bib39),39 (https://arxiv.org/html/2606.14139#bib.bib33)]。过去几十年中，已发展出多种方法来解决这一问题，包括叠加道的速度分析[6 (https://arxiv.org/html/2606.14139#bib.bib42)]、走时层析成像和基于偏移的方法[64 (https://arxiv.org/html/2606.14139#bib.bib43),13 (https://arxiv.org/html/2606.14139#bib.bib44)]，以及Born近似线性化反演[23 (https://arxiv.org/html/2606.14139#bib.bib45),35 (https://arxiv.org/html/2606.14139#bib.bib46)]。在这些方法中，全波形反演（FWI）[46 (https://arxiv.org/html/2606.14139#bib.bib47),57 (https://arxiv.org/html/2606.14139#bib.bib48),24 (https://arxiv.org/html/2606.14139#bib.bib49),51 (https://arxiv.org/html/2606.14139#bib.bib18)]因其能够恢复高分辨率地下结构而与众不同，它通过将反演问题表述为PDE约束优化，利用波场的完整相位和振幅信息，使模拟地震图与观测地震图在波动方程下对齐[51 (https://arxiv.org/html/2606.14139#bib.bib18),19 (https://arxiv.org/html/2606.14139#bib.bib50)]。  

FWI背后的优化问题被广泛认为是一个具有挑战性的非凸问题，原因是正演模拟的非线性以及反问题本身的病态性。相应的失配景观高度非凸，并存在大量由于相位模糊和地下照明有限而产生的局部极小值，使得反演对初始速度模型的不准确性、测量噪声和不完整采集高度敏感[51 (https://arxiv.org/html/2606.14139#bib.bib18),38 (https://arxiv.org/html/2606.14139#bib.bib58),62 (https://arxiv.org/html/2606.14139#bib.bib59),66 (https://arxiv.org/html/2606.14139#bib.bib23),63 (https://arxiv.org/html/2606.14139#bib.bib34),25 (https://arxiv.org/html/2606.14139#bib.bib36)]。一个特别典型的困难是周期跳跃，当预测道和观测道之间的错位超过半个周期时，梯度会将模拟波场导向一个相差整周期的匹配，优化过程陷入错误的吸引域，收敛到不准确的鞍点[20 (https://arxiv.org/html/2606.14139#bib.bib57),37 (https://arxiv.org/html/2606.14139#bib.bib6),34 (https://arxiv.org/html/2606.14139#bib.bib56)]。  

为了缓解这些困难并提高对不完美观测的鲁棒性，人们探索了多种补救措施。基于正则化的方法保留了标准的二次失配，并增加一个显式惩罚项来约束速度模型，其中Tikhonov正则化强制恢复场的平滑性[4 (https://arxiv.org/html/2606.14139#bib.bib5)]，全变差正则化促进保持尖锐界面的分段常数结构[18 (https://arxiv.org/html/2606.14139#bib.bib2),29 (https://arxiv.org/html/2606.14139#bib.bib3),1 (https://arxiv.org/html/2606.14139#bib.bib4)]。通过惩罚恢复速度中的非物理特征，这些正则化方法稳定了优化并提高了收敛精度，因此已成为FWI的标准基线。另一类工作用对微小时间和平移偏移不那么敏感的失配函数替代逐点二次残差，包括多尺度频率延续[9 (https://arxiv.org/html/2606.14139#bib.bib51)]、基于相位和包络的失配[8 (https://arxiv.org/html/2606.14139#bib.bib52),10 (https://arxiv.org/html/2606.14139#bib.bib53)]、自适应波形反演[56 (https://arxiv.org/html/2606.14139#bib.bib54)]，以及基于最优传输的几何感知度量[61 (https://arxiv.org/html/2606.14139#bib.bib55),34 (https://arxiv.org/html/2606.14139#bib.bib56)]。  

与这些经典策略并行的，还有大量工作探索了FWI的机器学习方法。直接监督映射从合成的地震图和速度模型对中学习逆算子[58 (https://arxiv.org/html/2606.14139#bib.bib7),68 (https://arxiv.org/html/2606.14139#bib.bib9),67 (https://arxiv.org/html/2606.14139#bib.bib8),28 (https://arxiv.org/html/2606.14139#bib.bib40)]。这些网络的计算效率远高于迭代优化，训练数据为病态反问题提供了隐式正则化，从而在FWI基准上取得了较强的经验精度。物理感知的变体将波动方程直接嵌入学习过程中。物理信息神经网络在配点上惩罚PDE残差[26 (https://arxiv.org/html/2606.14139#bib.bib24),32 (https://arxiv.org/html/2606.14139#bib.bib26),31 (https://arxiv.org/html/2606.14139#bib.bib25)]，相关方案将速度场参数化为神经网络，其权重通过FWI梯度更新[60 (https://arxiv.org/html/2606.14139#bib.bib60)]。PDE求解中一个更近且特别富有成效的范式是算子学习，其中神经网络逼近无限维空间之间的函数到函数映射[30 (https://arxiv.org/html/2606.14139#bib.bib10),69 (https://arxiv.org/html/2606.14139#bib.bib11)]。类似的算子架构也已用于FWI[22 (https://arxiv.org/html/2606.14139#bib.bib41)]。尽管取得这些进展，泛化能力仍然是监督方法的核心局限。它们在训练中未见过的速度结构以及受测量噪声污染的数据上精度下降，并且一旦采集几何改变，网络通常需要重新训练。  

近年来扩散模型的快速发展将生成建模提升到一个新水平，并为解决反问题开辟了新范式。通过学习一族高斯扰动边际分布\(\{p_t\}_{t\in[0,T]}\)的得分场\(\nabla_{\mathbf{x}}\log p_t(\mathbf{x})\)，扩散模型通过求解将标准高斯分布反向输送到数据分布的相关逆向随机微分方程来生成样本[21 (https://arxiv.org/html/2606.14139#bib.bib12),45 (https://arxiv.org/html/2606.14139#bib.bib14),43 (https://arxiv.org/html/2606.14139#bib.bib13)]。从反问题的角度来看，预训练的扩散模型将数据驱动先验嵌入反演中，提供了比手工设计替代方案更强的正则化，并提高了对测量噪声和分布外观测的鲁棒性。在图像域反问题中，已涌现出大量基于扩散的算法[27 (https://arxiv.org/html/2606.14139#bib.bib28),33 (https://arxiv.org/html/2606.14139#bib.bib17),16 (https://arxiv.org/html/2606.14139#bib.bib30),44 (https://arxiv.org/html/2606.14139#bib.bib29),12 (https://arxiv.org/html/2606.14139#bib.bib62),11 (https://arxiv.org/html/2606.14139#bib.bib38)]，而它们在物理PDE控制反问题中的应用仍探索不足[42 (https://arxiv.org/html/2606.14139#bib.bib16),40 (https://arxiv.org/html/2606.14139#bib.bib15),54 (https://arxiv.org/html/2606.14139#bib.bib35)]。具体到FWI，一类工作将FWI物理约束步骤插入扩散采样轨迹中，包括DiffusionFWI及其DiffusionILVR扩展[52 (https://arxiv.org/html/2606.14139#bib.bib1),49 (https://arxiv.org/html/2606.14139#bib.bib37)]，以及应用于波动方程算子的DPS变体[48 (https://arxiv.org/html/2606.14139#bib.bib64),36 (https://arxiv.org/html/2606.14139#bib.bib65)]。然而，施加的物理约束步骤通常与采样流所访问的高斯噪声边际不一致，且平衡数据先验有效性与物理约束执行的超参数选择成为核心困难。第二类工作将基于扩散模型的正则化项直接嵌入FWI优化目标中[41 (https://arxiv.org/html/2606.14139#bib.bib61),59 (https://arxiv.org/html/2606.14139#bib.bib63)]。这些工作共同表明，扩散先验可以为FWI提供有意义的结构信息；但从预训练模型中提取先验信号的形式以及将其注入反演的方式仍然是开放的设计选择，这促使了本工作的开展。  

在本文中，我们开发了一个通用框架——**解耦潜在变量优化**（DLO），它将预训练的扩散模型作为正则化机制嵌入PDE控制的反问题中。DLO引入了一个辅助的可优化潜在变量，其解码后的样本近似物理变量的先验投影，为物理反演提供扩散先验正则化信号。该框架继承了扩散先验方法对分布外结构的强泛化能力。我们在大规模FWI基准上验证DLO，并将其与经典正则化方法和现有扩散方法进行比较。在OpenFWI基准[15 (https://arxiv.org/html/2606.14139#bib.bib19)]上，DLO在重建精度上持续优于这些基线，并在测量噪声和不完整采集下保持鲁棒。我们进一步将该框架应用于明显超出训练分布的Marmousi[50 (https://arxiv.org/html/2606.14139#bib.bib20)]和Overthrust[2 (https://arxiv.org/html/2606.14139#bib.bib21)]基准，这些模型上的成功重建表明DLO能够扩展到更大的区域，并很好地适应实际野外数据中遇到的复杂地质结构。  

本文的剩余部分组织如下。第2节 (https://arxiv.org/html/2606.14139#S2) 阐述了FWI，回顾了扩散生成模型，并调查了现有的基于扩散的反问题方法。第3节 (https://arxiv.org/html/2606.14139#S3) 提出了解耦潜在变量优化并分析了其收敛性质。第4节 (https://arxiv.org/html/2606.14139#S4) 报告了在OpenFWI、Marmousi和Overthrust基准上的数值实验。第5节 (https://arxiv.org/html/2606.14139#S5) 总结了局限性并展望了未来方向。实现细节、超参数和额外实验结果见附录。  

## 2 背景与预备知识  

### 2.1 全波形反演  
全波形反演（FWI）从地表采集的地震波场测量中恢复地下速度场[51 (https://arxiv.org/html/2606.14139#bib.bib18),47 (https://arxiv.org/html/2606.14139#bib.bib31)]。在声学近似下，地下域\(\Omega\)中的波传播由以下方程控制：  

\[
\begin{aligned}
&\frac{1}{v(\mathbf{r})^2}\frac{\partial^2 p(\mathbf{r},t)}{\partial t^2}=\nabla^2 p(\mathbf{r},t)+s(\mathbf{r},t,\xi),\\
&p(\mathbf{r},0)=0,\\
&p_t(\mathbf{r},0)=0.
\end{aligned}
\tag{1}
\]

其中\(\mathbf{r}\in\Omega\)为空间坐标，\(t\)为时间，\(\nabla^2\)为空间拉普拉斯算子，\(v(\mathbf{r})\)为空间变化的地下速度，\(p(\mathbf{r},t)\)为压力波场。源项\(s(\mathbf{r},t,\xi)\)通常是地表点源发出的Ricker子波，表示如下：  

\[
s(\mathbf{r},t,\xi)=s_0(t)\,\delta(\mathbf{r}-\xi), \tag{2}
\]

其中\(s_0(t)=(1-2\pi^2 f^2 t^2)e^{-\pi^2 f^2 t^2}\)为频率\(f\)的Ricker子波振幅，\(\delta\)为狄拉克函数，\(\xi\)为源的位置。遵循OpenFWI框架，我们使用吸收边界层来模拟无界介质中的波传播，抑制来自域边界的人工反射。  

在典型的地表采集中，介质由一组源\(\{\xi_i\}_{i=1}^{n_s}\)探测。波场通过测量算子\(\mathcal{M}\)观测，该算子在地表浅层接收点\(\{\mathbf{r}_j\}_{j=1}^{n_r}\)处测量波场：  

\[
\mathcal{M}\,p(\mathbf{r},\cdot,t;v,\xi_i)=\{p(\mathbf{r}_j,t;v,\xi_i)\}_{j=1}^{n_r}.
\]

对于源\(\xi_i\)，求解波动方程(1)与速度\(v\)可得到波场\(p(\mathbf{r},t;v,\xi_i)\)，其测量即为模拟记录。将所有源的这些记录汇总，定义正演算子：  

\[
\mathcal{F}(v)=\bigl\{\,p(\mathbf{r}_j,t;v,\xi_i)\,\bigr\}_{j=1,\dots,n_r,\;i=1,\dots,n_s},\qquad t\in[0,T], \tag{3}
\]

该算子将速度模型映射到每个源-接收对对应的波场采样。通常，观测数据\(\mathbf{d}_{\mathrm{obs}}\)是由真实速度模型\(v^*\)生成的波场，在相同接收点处测量并受到加性测量噪声污染。

用于全波形反演的扩散模型解耦潜在优化

相似文章

展开与回滚：扩散大语言模型是自身的效率教师

深度之梦由此而成：可视化扩散模型中的单义特征

无漂移扩散策略优化

线性约束下的条件扩散：Langevin 混合与信息论保证

D-OPSD：面向连续微调步骤蒸馏扩散模型的在线策略自蒸馏

提交意见反馈