SP^3: 用于即插即用恢复的球面先验
摘要
本文介绍SP³,一种使用球面编码器先验的即插即用图像恢复方法,在各项任务中实现与零样本扩散先验相当的感知质量,同时速度快3-630倍。
查看缓存全文
缓存时间: 2026/06/16 11:31
论文页面 - SP^3:用于即插即用恢复的球面先验
来源:https://huggingface.co/papers/2606.16396
大家好,很高兴与大家分享我们关于使用球面先验进行即插即用恢复的新论文。
核心思路是用球面编码器先验替换PnP恢复中常用的去噪器/扩散先验。SP3每次迭代后都能生成自然逼真的图像,后续迭代会进一步提升质量和一致性。这种“任意时刻“恢复行为是相对于扩散方法的关键优势——后者需要预先选择去噪步数,并完整运行至终点。
在我们的实验中,SP3达到了与零样本扩散和流先验相当的感知质量,同时在各种恢复任务中速度快了3–630倍。
欢迎提出关于算法、结果或球面先验设计的问题。
相似文章
VidSplat:利用几何引导的视频扩散先验进行高斯泼溅重建
VidSplat 是一种无需训练的生成式重建框架,它利用视频扩散先验,通过合成新视角,从稀疏输入中恢复完整的 3D 场景。
PRISM: 先验纠正与不确定性感知结构建模的基于扩散的文本图像超分辨率
PRISM是一个基于扩散的文本图像超分辨率框架,利用流匹配先验纠正和不确定性感知残差编码来提升严重退化下的准确性,实现了毫秒级推理的最新性能。
超越3D VQA:将3D空间先验注入视觉语言模型以增强几何推理
本文提出GASP框架,通过深度监督结合对比损失和深度一致性损失将几何先验注入视觉语言模型,在3D空间推理基准上取得了显著提升,且无需使用3D VQA数据。
使用球面潜编码器的高效图像合成
本文提出 Sphere Latent Encoder,一种高效的少步图像生成框架,该框架完全在球面潜空间中进行去噪,能够在 ImageNet-1K 上以显著降低的计算成本生成高质量 256×256 图像,并提升 FID 分数。
几何至关重要:用于学习语义对应的3D基础先验
本文介绍了一个后训练框架,利用SAM3D的3D先验来改进2D基础特征中的语义对应,解决了左右混淆和重复部分等问题。该方法使用实例特定的3D重建,无需姿态注释或球面几何捷径。