一致性模型
摘要
OpenAI 推出一致性模型,这是一类新的生成模型,通过直接将噪声映射到数据,支持快速单步图像生成,同时支持多步采样和零次学习编辑任务(如图像修复和超分辨率)。该方法在 CIFAR-10 和 ImageNet 64x64 上的单步生成中实现了最先进的 FID 分数。
扩散模型在图像、音频和视频生成领域取得了显著进展,但它们依赖于迭代采样过程,导致生成速度缓慢。
查看缓存全文
缓存时间: 2026/04/20 14:47
# 一致性模型
来源: https://openai.com/index/consistency-models/
扩散模型在图像、音频和视频生成领域取得了显著进展,但它们依赖于迭代采样过程,导致生成速度缓慢。为了克服这一限制,我们提出了一致性模型——一类新型模型,通过直接将噪声映射到数据来生成高质量样本。它们的设计天然支持快速单步生成,同时仍允许多步采样来平衡计算量和样本质量。它们还支持零样本数据编辑,如图像修复、着色和超分辨率,无需为这些任务进行显式训练。一致性模型既可以通过蒸馏预训练的扩散模型来训练,也可以作为独立的生成模型训练。通过广泛的实验,我们证明了它们在单步和少步采样中优于现有的扩散模型蒸馏技术,在 CIFAR-10 上单步生成的 FID 达到 3.55(新的最先进水平),在 ImageNet 64x64 上达到 6.20。当独立训练时,一致性模型成为一类新的生成模型,在 CIFAR-10、ImageNet 64x64 和 LSUN 256x256 等标准基准上的性能可以超越现有的单步非对抗性生成模型。
相似文章
改进的一致性模型训练技术
OpenAI 展示了改进的一致性模型训练技术,无需蒸馏即可实现高质量单步图像生成,通过新型损失函数和训练策略在 CIFAR-10 和 ImageNet 64×64 上取得显著的 FID 改进。
简化、稳定和扩展连续时间一致性模型
OpenAI 推出 sCM(简化连续时间一致性模型),这是一种新方法,可将一致性模型扩展至 1.5B 参数,通过仅 2 个采样步骤生成高质量样本,相比扩散模型实现约 50 倍的加速。该方法展示了与最先进扩散模型相当的样本质量,同时有效采样计算量不足 10%。
生成式模型
OpenAI 发布了关于生成式模型的概览,将其作为开发机器理解世界的方法,解释了这些模型如何通过学习生成与训练集相似的数据来工作,以及它们在各个领域的潜在应用。
OpenAI新Images 2模型太强:角色完全一致,文字清晰不变
OpenAI发布升级图像模型,跨帧保持角色外观完美一致,文字清晰稳定。
全新 ChatGPT 图像模型树立逼真图像生成新标杆
OpenAI 发布全新 ChatGPT 图像模型,为逼真图像生成设立新基准。