阐明扩散概率模型的SNR-t偏差

Hugging Face Daily Papers 论文

摘要

# 论文页面 - 阐明扩散概率模型的SNR-t偏差 来源:[https://huggingface.co/papers/2604.16044](https://huggingface.co/papers/2604.16044) ## 摘要 扩散概率模型在推理阶段存在SNR-timestep偏差,本文提出一种微分校正方法,对频率分量分别处理,以极低计算代价提升多种模型的生成质量。 [扩散概率模型](https://hugg

扩散概率模型在众多生成任务中表现卓越,但我们发现它们常受信噪比-时间步(SNR-t)偏差困扰。该偏差指去噪样本的SNR与其在推理阶段对应时间步之间的不一致。训练时,样本的SNR与时间步严格耦合;推理时该对应关系被破坏,导致误差累积并损害生成质量。我们提供充分实验证据与理论分析证实该现象,并提出一种简单高效的微分校正方法缓解SNR-t偏差。考虑到扩散模型在反向去噪过程中通常先重建低频分量再关注高频细节,我们将样本分解为不同频率分量并分别施加微分校正。大量实验表明,该方法在几乎零额外计算开销下显著提升多种扩散模型(IDDPM、ADM、DDIM、A-DPM、EA-DPM、EDM、PFGM++、FLUX)在不同分辨率数据集上的生成质量。代码地址:https://github.com/AMAP-ML/DCW
查看原文
查看缓存全文

缓存时间: 2026/04/21 07:21

论文页面 - 阐明扩散概率模型的 SNR-t 偏差

来源:https://huggingface.co/papers/2604.16044

摘要

扩散概率模型在推理阶段存在 SNR-timestep 偏差,本文通过一种“按频率分量分别处理”的微分校正方法解决该问题,在几乎不增加计算量的前提下,显著提升多种模型的生成质量。

扩散概率模型(Diffusion Probabilistic Models)在各类生成任务中表现卓越,但我们发现它们普遍存在信噪比-时间步(SNR-t)偏差。该偏差指去噪样本的 SNR 与其对应时间步在推理阶段出现错位。训练时,样本的 SNR 与时间步严格绑定;推理时这一对应关系被破坏,导致误差累积,损害生成质量。我们通过大量实验与理论分析验证该现象,并提出一种简单高效的微分校正方法予以缓解。考虑到扩散模型在反向去噪过程中通常先重建低频成分再补全高频细节,我们将样本分解为不同频率分量,并对各分量单独施加微分校正。广泛实验表明,该方法在几乎零额外计算的前提下,显著提升 IDDPM、ADM、DDIM、A-DPM、EA-DPM、EDM、PFGM++ 及 FLUX 等多种扩散模型在不同分辨率数据集上的生成质量。代码开源地址:
https://github.com/AMAP-ML/DCW

查看 arXiv 页面(https://arxiv.org/abs/2604.16044)
查看 PDF(https://arxiv.org/pdf/2604.16044)
GitHub 71(https://github.com/AMAP-ML/DCW)
加入收藏

在本地代理中阅读:

hf papers read 2604.16044

尚未安装最新 CLI?
curl -LsSf https://hf.co/cli/install.sh | bash

引用该论文的模型 0

暂无模型引用

在模型 README.md 中引用 arxiv.org/abs/2604.16044 即可在此处显示。

引用该论文的数据集 0

暂无数据集引用

在数据集 README.md 中引用 arxiv.org/abs/2604.16044 即可在此处显示。

引用该论文的 Spaces 0

暂无 Spaces 引用

在 Space README.md 中引用 arxiv.org/abs/2604.16044 即可在此处显示。

收录该论文的合集 3

相似文章

扩散模型的时间差分学习

arXiv cs.LG

本文提出了一种用于扩散模型的时间差分(TD)学习目标,该目标在去噪轨迹上强制跨时间一致性。它将去噪重新表述为强化学习中的策略评估问题,展示了在样本质量(FID)上的显著改进,尤其适用于少步采样器。

面向扩散模型的类频率引导噪声调度

arXiv cs.LG

本文提出了一种面向扩散模型的类频率引导噪声调度,为低频类别分配更大尺度的噪声,以改善在不平衡数据集上的生成质量,相较于基线方法取得了显著提升。