Christoffel-DPS:在任意分布的扩散后验采样中进行最优传感器放置
摘要
本文介绍了 Christoffel-DPS,这是一个用于扩散后验采样中最优传感器放置的无分布依赖框架,其性能优于传统的基于高斯假设的方法。它为使用生成式模型从复杂非高斯分布中重建状态提供了理论保证和实际改进。
arXiv:2605.06861v1 公告类型:新文章
摘要:状态估计在科学、工程和控制系统应用中是一项关键任务。由于重建的可靠性取决于传感器的数量和位置,在测量稀疏且昂贵的场景中,最优传感器放置(OSP)至关重要。传统的 OSP 方法依赖于高斯假设,因此无法应对许多现实世界系统中遇到的复杂分布。使用传感器引导的扩散后验采样(DPS)基于生成式模型的重建技术已成为从高度复杂分布中重建状态的一种有前景的方法。然而,现有的传感器选择方法要么需要不切实际的大量传感器,要么模仿传统的 OSP,从而导致现代恢复模型与传统 OSP 工具之间存在不匹配,这促使我们需要根本性的新思路,以匹配在强大恢复模型方面取得的最新进展。
我们介绍了一种基于 Christoffel 函数的无分布依赖传感器放置框架:这是一种数学公式,为具有任意传感器和信号分布的后验采样提供了最优采样和恢复保证,从中我们推导出了一新的 OSP 策略,并对恢复所需的传感器数量提供了非渐近界。我们开发了 Christoffel-DPS,包含离线和在线变体,为生成式模型实现了 Christoffel 采样。Christoffel-DPS 的性能优于高斯 OSP 基线及现有的生成式模型放置方法,验证了无分布依赖传感在理论上具有原则性,在实践中也更具优势。该框架与模型无关;我们展示了其在一系列无条件 DPS 和流匹配模型上的应用,这些模型在结构上非高斯的基准测试上表现出色,证明了 Christoffel-DPS 在低传感器预算环境中的有效性。
查看缓存全文
缓存时间: 2026/05/11 06:57
# Christoffel-DPS:针对任意分布的扩散后验采样中的最优传感器放置
来源: https://arxiv.org/html/2605.06861
James Rowbottom 英国剑桥大学应用数学与理论物理系 jr908@cam\.ac\.uk&Nick Huang11脚注标记:1 加拿大西蒙弗雷泽大学数学系 nick\_huang@sfu\.ca&Carola\-Bibiane Schönlieb 英国剑桥大学应用数学与理论物理系 cbs31@cam\.ac\.uk&Ben Adcock 加拿大西蒙弗雷泽大学数学系 ben\_adcock@sfu\.ca
###### 摘要
状态估计是科学、工程和控制应用中的关键任务。由于重建的可靠性取决于传感器的数量和位置,因此在测量稀疏且昂贵的场景中,最优传感器放置(Optimal Sensor Placement, OSP)至关重要。经典的OSP方法依赖于高斯假设,因此无法处理许多现实世界系统中遇到的复杂分布。基于生成模型的重建利用传感器引导的扩散后验采样(Diffusion Posterior Sampling, DPS)已成为从高度复杂分布中重建状态的一种有前景的技术。然而,现有的传感器选择方法要么需要不切实际的大量传感器,要么模仿经典OSP,从而在现代恢复模型与经典OSP工具之间造成了不匹配,这促使我们需要从根本上提出新的OSP思想,以匹配强大恢复模型的最新进展。我们引入了一种基于Christoffel函数的免分布(distribution-free)传感器放置框架:这是一种针对任意传感器和信号分布的后验采样的最优采样和恢复保证的数学表述,并从中推导出了一个新的OSP策略,该策略对恢复所需的传感器数量提供了非渐近界。我们开发了Christoffel-DPS,包含离线和在线变体,为生成模型实例化Christoffel采样。Christoffel-DPS优于高斯OSP基线和现有的生成模型放置方法,验证了免分布传感在理论上严谨且在实际中更优。该框架与模型无关;我们展示了其在一系列无条件DPS和流匹配(flow-matching)模型上的应用,这些模型基于结构上非高斯的基准测试,证明了Christoffel-DPS在低传感器预算 regime 下的有效性。
## 1 引言
从稀疏测量中进行状态重建是科学与工程领域的一个重要问题。应用包括从浮标网络中进行海洋状态估计、从气象站进行大气数据同化、从压力测点重建气动表面周围的流体流动、从接收器阵列进行地震成像以及从压缩测量中进行生物医学成像。在这样的设置中,传感器的部署和运行成本高昂,信号存在于高维或无限维的状态空间中,传感器的数量和位置可能是控制重建精度的主导因素。最优传感器放置(OSP)旨在如何选择这些测量,以在规定的传感预算下最大化重建精度。
OSP的经典方法与线性恢复方法、降阶建模和高斯假设密切相关。在贝叶斯最优实验设计(OED)中,标准的A-、D-和E-最优性准则优化后验协方差矩阵的泛函。典型方法,包括有间隙的POD(Everson and Sirovich, 1995 (https://arxiv.org/html/2605.06861#bib.bib18); Willcox, 2006 (https://arxiv.org/html/2605.06861#bib.bib47))、高斯过程和克里金回归(Krause et al., 2008 (https://arxiv.org/html/2605.06861#bib.bib29))、集合卡尔曼滤波,以及降阶POD-Galerkin、DEIM/QDEIM模型(Chaturantabut and Sorensen, 2010 (https://arxiv.org/html/2605.06861#bib.bib10); Drmač and Gugercin, 2016 (https://arxiv.org/html/2605.06861#bib.bib15))和SSPOR(Manohar et al., 2018 (https://arxiv.org/html/2605.06861#bib.bib35)),选择传感器使得缩减基在限制于传感器测量时具有良好的条件数。这些方法非常成功,并且通常具有算法和理论保证。然而,它们的放置准则通常源于线性和高斯假设,因此它们不直接利用复杂信号分布的几何结构,如多峰、强非高斯或流形支持的先验。
随着学习型恢复算子的快速增长,这种局限性变得越来越重要。从稀疏测量到全场监督逆映射是自然起点:Voronoi剖分CNNs(Fukami et al., 2021 (https://arxiv.org/html/2605.06861#bib.bib19))、变换器重建器如Senseiver(Santos et al., 2023 (https://arxiv.org/html/2605.06861#bib.bib42))和Energy Transformer(Zhang et al., 2025 (https://arxiv.org/html/2605.06861#bib.bib50))、DeepONet风格的算子网络(Dang and Nguyen, 2025 (https://arxiv.org/html/2605.06861#bib.bib13)),以及非结构化网格上的图变换器重建器(Duthé et al., 2025 (https://arxiv.org/html/2605.06861#bib.bib16))。生成式重建器采取概率视角:PhySense(Ma et al., 2025 (https://arxiv.org/html/2605.06861#bib.bib34))在随机传感器布局上训练条件流匹配重建器,并通过针对重建损失的投影梯度下降事后优化放置;SDIFT(Chen et al., 2025 (https://arxiv.org/html/2605.06861#bib.bib11))在学习的功能Tucker潜在空间中运行顺序扩散,用于不规则稀疏观测的消息传递后验采样;DiffusionPDE(Huang et al., 2024 (https://arxiv.org/html/2605.06861#bib.bib22))和FunDPS保持无条件扩散先验,并在采样时添加测量和PDE残差引导,ConFIG(Amorós-Trepat et al., 2026 (https://arxiv.org/html/2605.06861#bib.bib5))引入无冲突梯度投影以稳定多目标引导,DDO(Lime et al., 2023 (https://arxiv.org/html/2605.06861#bib.bib31))通过Cameron-Martin几何直接在函数空间中工作,DDIS(Lin et al., 2026 (https://arxiv.org/html/2605.06861#bib.bib74))通过在采样时用单独学习的算子强制PDE约束来解耦联合状态训练。
总体而言,这些模型与经典OSP的设置相去甚远。生成模型,特别是基于全状态样本训练的扩散模型(Karras et al., 2022 (https://arxiv.org/html/2605.06861#bib.bib26)),编码了高度表达力的非高斯先验,并允许通过扩散后验采样(DPS)(Chung et al., 2023 (https://arxiv.org/html/2605.06861#bib.bib70))和其他技术(Baldassari et al., 2026 (https://arxiv.org/html/2605.06861#bib.bib66))进行恢复。在完美训练的去噪器极限下,先验对我们的目的而言充当预言机,将概率质量集中在合理状态的流形上,并使后验高度非高斯。尽管发生了这种转变,生成恢复算子的OSP发展相对滞后。PhySense的投影梯度阶段(Ma et al., 2025 (https://arxiv.org/html/2605.06861#bib.bib34))是唯一完全端到端的放置循环,但其重建损失目标是均方误差,且其传感器优化在其建模假设下回归到高斯似然处理,使其本质上等同于A-最优设计。基于集合的方法,如Chakraborty et al. (2026 (https://arxiv.org/html/2605.06861#bib.bib8))的逐像素标准差分数、Xue et al. (2024 (https://arxiv.org/html/2605.06861#bib.bib48))的梯度加权类激活图、Karczewski et al. (2024 (https://arxiv.org/html/2605.06861#bib.bib24))的卡通风格不确定性,以及Deng et al. (2021 (https://arxiv.org/html/2605.06861#bib.bib14))的EnKF驱动神经网络,在精神上也是A-最优的,通过对集合的二阶矩总结来评分传感器;基于注意力的放置(Zhao et al., 2025 (https://arxiv.org/html/2605.06861#bib.bib51))和Marcato et al. (2024 (https://arxiv.org/html/2605.06861#bib.bib36))的课程改革公式也属于同一广泛的高斯家族。严格意义上,它们都不是免分布的,也没有非渐近恢复保证来匹配底层生成先验的表达力。
本文旨在填补这一空白。我们引入了一个OSP的理论框架,为任意信号分布提供非渐近恢复保证。利用这一点,我们随后推导出了DPS设置下的一种新颖策略,即Christoffel-DPS。我们的具体贡献如下:
1. (i)一个新颖的理论框架,用于具有任意(特别是生成式)先验的恢复,不需要高斯假设,并适用于任何线性测量。
2. (ii)一种新颖的OSP策略,Christoffel采样,对于任何给定的先验在理论上都是最优的。
3. (iii)DPS中Christoffel采样的实用实现,称为Christoffel-DPS,具有离线和在线变体,用于从点测量中进行全状态重建。
4. (iv)在一组科学数据集上的实验,展示了与其他OSP策略相比,Christoffel-DPS对生成先验的优势。图1 (https://arxiv.org/html/2605.06861#S1.F1)显示了一个典型的实验结果。
我们的OSP策略与经典OED准则根本不同。A-、D-和E-最优设计最小化后验协方差椭球的平均大小——换句话说,它们考虑测量集将后验向平均状态收敛的程度——而Christoffel采样控制先验支撑集的割线集上测量能量与信号能量之间的最坏情况比率。因此,它询问测量集在任意候选信号之间*识别*的可靠性。后者对于任意分布都是明确定义的,并且不需要线性或高斯假设。目标从后验坍缩到噪声下的可识别性的转变,使得我们的框架在后验非高斯、多峰或由学习流形支持时仍然有意义。Christoffel函数最近已成为确定性(非贝叶斯)恢复中的强大工具,使用线性Cohen and Migliorati (2017 (https://arxiv.org/html/2605.06861#bib.bib67))和非线性估计器Adcock et al. (2023 (https://arxiv.org/html/2605.06861#bib.bib60))。在前一种情况下,它们与杠杆分数密切相关Chen et al. (2016 (https://arxiv.org/html/2605.06861#bib.bib68)); Ma et al. (2015 (https://arxiv.org/html/2605.06861#bib.bib69))。然而,将它们用于贝叶斯后验采样似乎是新的。
参考标题 图1:集合Christoffel-DPS。Pinball数据集上的两条DPS采样轨迹。第1行(随机):6个位于随机位置的固定传感器。第2行(Christoffel-DPS):3个固定锚定传感器(∙{\color[rgb]{0,1,1}\bullet})通过离线Christoffel-DPS定位,3个移动传感器(∙{\color[rgb]{0,1,0}\bullet})由集合贪婪更新在线选择。列:真值;中间噪声状态$x_{t^*}$;第1行 Tweedie估计集合标准差$\sigma(\hat{x}_0)$,第2行驱动移动传感器漂移的经验Christoffel分数;$T=0$时的最终重建。
## 2 Christoffel采样的设置与背景
状态重建涉及从稀疏的噪声传感器测量中恢复定义在域$\Theta$(通常是$\mathbb{R}^d$的子集)上的未知信号$f^*:\Theta\rightarrow\mathbb{R}$
$y_i=f^*(\theta_i)+n_i,\quad i=1,\ldots,m,$
其中$n_i\sim_{\mathrm{i.i.d.}}\mathcal{N}(0,\sigma^2)$。OSP是选择传感器位置$\theta_1,\ldots,\theta_n\in\Theta$以最大化恢复状态(我们记为$\hat{f}$)精度的问题。在本工作中,我们专注于后验采样技术,特别是DPS。设$\mathcal{P}$为先验信号分布,通常是生成先验。然后后验采样涉及绘制$\hat{f}\sim\mathcal{P}(\cdot|y,\theta)$,其中$y=(y_i)_{i=1}^m$和$\theta=(\theta_i)_{i=1}^m$。因此,后验采样中的OSP目标是通过选择$\theta$来最大化$\hat{f}$对$f^*$的保真度。
考虑配备某个测度$\rho$的域$\Theta$。我们工作中的关键对象是$\mathcal{P}$的Christoffel函数$K(\mathcal{P})$,定义为
$K(\mathcal{P}):\theta\in\Theta\mapsto\sup_{f\in\mathbb{S}(\mathcal{P})}\|f(\theta)\|^2\in\mathbb{R}.$
这里$\mathbb{S}(\mathcal{P})$是$\mathrm{supp}(\mathcal{P})$的割线集
$\mathbb{S}(\mathcal{P})=\left\{\frac{f_1-f_2}{\|f_1-f_2\|}:f_1\neq f_2\in\mathrm{supp}(\mathcal{P})\right\}\tag{2.1}$
且$\|\cdot\|$是$L^2_\rho(\Theta)$范数。该函数与从$\mathcal{P}$的信号从其传感器值进行可识别性密切相关。如果$K(\mathcal{P})(\theta)$很大,这意味着位置$\theta$处的传感器读数可以更好地识别来自$\mathcal{P}$的潜在信号,而当$K(\mathcal{P})(\theta)$很小时,传感器读数提供的信息很少。Christoffel采样(在本工作中稍后开发)使用此函数来指导传感器放置,力求在后验采样背景下最大化可识别性。
注意,在实践中,状态重建问题通常在有限网格上表述。设$\{\xi_i\}_{i=1}^N\subset\Theta$为固定节点网格,并通过$x^*_i=f^*(\xi_i)$将向量$x^*\in\mathbb{R}^N$与$f^*$联系起来。在这种情况下,$K(\mathcal{P})$成为$\{1,\ldots,N\}$上的评分函数,其中$K(\mathcal{P})(j)=\sup_{f\in\mathbb{S}(\mathcal{P})}\|f(\xi_j)\|^2$。这里,我们还采用符号$S\in\mathbb{R}^{m\times N}$表示由单位矩阵$I_N$的$m$行组成的行选择矩阵,对应于选定的传感器,并将测量表示为
$y_S=Sx^*+n,\quad n\sim\mathcal{N}(0,\sigma^2I_m).\tag{2.2}$
## 3 理论设置与结果
我们现在描述一个用于理论OSP的通用框架。我们基于Adcock and Huang (2025 (https://arxiv.org/html/2605.06861#bib.bib59)); Jalali et al. (2021 (https://arxiv.org/html/2605.06861#bib.bib56)),它们引入了一个贝叶斯恢复框架,但仅限于有限维向量空间之间的线性测量,且在后者情况下为高斯测量(不适用于状态重建)。我们在此开发的一个关键推广是从在$\mathbb{R}^N$中表述的问题扩展到任意希尔伯特空间。此外,出于我们在§A (https://arxiv.org/html/2605.06861#A1)中详述的技术原因,先前工作中的框架不适合OSP,因为它假设测量与噪声之间相互独立。我们放松了这一假设...相似文章
线性约束下的条件扩散:Langevin 混合与信息论保证
本文分析了预训练扩散模型在线性逆问题上的零样本条件采样,提供了信息论保证并提出了一种投影 Langevin 初始化方法。
D-OPSD:面向连续微调步骤蒸馏扩散模型的在线策略自蒸馏
本文介绍了 D-OPSD,一种用于步骤蒸馏扩散模型的新型训练范式,能够在监督微调过程中实现在线策略自蒸馏。该方法使模型能够在不损害其高效少步推理能力的前提下,学习新概念或新风格。
通过稀疏内部快照实现骨干均衡的扩散模型异常检测
本文提出了一种公平比较基于扩散模型的异常检测器的协议,并提出了规范特征快照(CFS),该算法利用稀疏的内部激活状态实现高效的异常检测。
阐明扩散概率模型的SNR-t偏差
# 论文页面 - 阐明扩散概率模型的SNR-t偏差 来源:[https://huggingface.co/papers/2604.16044](https://huggingface.co/papers/2604.16044) ## 摘要 扩散概率模型在推理阶段存在SNR-timestep偏差,本文提出一种微分校正方法,对频率分量分别处理,以极低计算代价提升多种模型的生成质量。 [扩散概率模型](https://hugg
用于条件生成压缩感知的主动学习
本文提出了一个条件生成压缩感知框架,证明了基于提示词条件化模型在稳定恢复方面的界限,并通过在 Stable Diffusion 上的实验展示了提示词匹配如何影响采样分布。