阐明扩散概率模型的SNR-t偏差
摘要
# 论文页面 - 阐明扩散概率模型的SNR-t偏差 来源:[https://huggingface.co/papers/2604.16044](https://huggingface.co/papers/2604.16044) ## 摘要 扩散概率模型在推理阶段存在SNR-timestep偏差,本文提出一种微分校正方法,对频率分量分别处理,以极低计算代价提升多种模型的生成质量。 [扩散概率模型](https://hugg
查看缓存全文
缓存时间: 2026/04/21 07:21
论文页面 - 阐明扩散概率模型的 SNR-t 偏差
来源:https://huggingface.co/papers/2604.16044
摘要
扩散概率模型在推理阶段存在 SNR-timestep 偏差,本文通过一种“按频率分量分别处理”的微分校正方法解决该问题,在几乎不增加计算量的前提下,显著提升多种模型的生成质量。
扩散概率模型(Diffusion Probabilistic Models)在各类生成任务中表现卓越,但我们发现它们普遍存在信噪比-时间步(SNR-t)偏差。该偏差指去噪样本的 SNR 与其对应时间步在推理阶段出现错位。训练时,样本的 SNR 与时间步严格绑定;推理时这一对应关系被破坏,导致误差累积,损害生成质量。我们通过大量实验与理论分析验证该现象,并提出一种简单高效的微分校正方法予以缓解。考虑到扩散模型在反向去噪过程中通常先重建低频成分再补全高频细节,我们将样本分解为不同频率分量,并对各分量单独施加微分校正。广泛实验表明,该方法在几乎零额外计算的前提下,显著提升 IDDPM、ADM、DDIM、A-DPM、EA-DPM、EDM、PFGM++ 及 FLUX 等多种扩散模型在不同分辨率数据集上的生成质量。代码开源地址:
https://github.com/AMAP-ML/DCW
查看 arXiv 页面(https://arxiv.org/abs/2604.16044)
查看 PDF(https://arxiv.org/pdf/2604.16044)
GitHub 71(https://github.com/AMAP-ML/DCW)
加入收藏
在本地代理中阅读:
hf papers read 2604.16044
尚未安装最新 CLI?
curl -LsSf https://hf.co/cli/install.sh | bash
引用该论文的模型 0
暂无模型引用
在模型 README.md 中引用 arxiv.org/abs/2604.16044 即可在此处显示。
引用该论文的数据集 0
暂无数据集引用
在数据集 README.md 中引用 arxiv.org/abs/2604.16044 即可在此处显示。
引用该论文的 Spaces 0
暂无 Spaces 引用
在 Space README.md 中引用 arxiv.org/abs/2604.16044 即可在此处显示。
收录该论文的合集 3
相似文章
扩散模型的时间差分学习
本文提出了一种用于扩散模型的时间差分(TD)学习目标,该目标在去噪轨迹上强制跨时间一致性。它将去噪重新表述为强化学习中的策略评估问题,展示了在样本质量(FID)上的显著改进,尤其适用于少步采样器。
面向扩散模型的类频率引导噪声调度
本文提出了一种面向扩散模型的类频率引导噪声调度,为低频类别分配更大尺度的噪声,以改善在不平衡数据集上的生成质量,相较于基线方法取得了显著提升。
线性约束下的条件扩散:Langevin 混合与信息论保证
本文分析了预训练扩散模型在线性逆问题上的零样本条件采样,提供了信息论保证并提出了一种投影 Langevin 初始化方法。
NoiseRater:用于扩散模型训练的元学习噪声评估
本文介绍了 NoiseRater,这是一种元学习框架,在扩散模型训练期间为各个噪声样本分配重要性评分,以提高训练效率和生成质量。
Prob-BBDM:一种用于MRI序列图像到图像翻译的概率性布朗桥扩散模型
本文介绍了Prob-BBDM,一种概率性布朗桥扩散模型,能够从2D轴向切片高效高质量地合成MRI序列,仅需4步扩散即可达到88.46% SSIM和26.09 dB PSNR,并在肿瘤分割中展现出临床实用性。