一致性模型

OpenAI Blog 2024/06/20 00:00 论文

摘要

OpenAI 推出一致性模型，这是一类新的生成模型，通过直接将噪声映射到数据，支持快速单步图像生成，同时支持多步采样和零次学习编辑任务（如图像修复和超分辨率）。该方法在 CIFAR-10 和 ImageNet 64x64 上的单步生成中实现了最先进的 FID 分数。

扩散模型在图像、音频和视频生成领域取得了显著进展，但它们依赖于迭代采样过程，导致生成速度缓慢。

查看原文

查看缓存全文

缓存时间: 2026/04/20 14:47

# 一致性模型来源: https://openai.com/index/consistency-models/ 扩散模型在图像、音频和视频生成领域取得了显著进展，但它们依赖于迭代采样过程，导致生成速度缓慢。为了克服这一限制，我们提出了一致性模型——一类新型模型，通过直接将噪声映射到数据来生成高质量样本。它们的设计天然支持快速单步生成，同时仍允许多步采样来平衡计算量和样本质量。它们还支持零样本数据编辑，如图像修复、着色和超分辨率，无需为这些任务进行显式训练。一致性模型既可以通过蒸馏预训练的扩散模型来训练，也可以作为独立的生成模型训练。通过广泛的实验，我们证明了它们在单步和少步采样中优于现有的扩散模型蒸馏技术，在 CIFAR-10 上单步生成的 FID 达到 3.55（新的最先进水平），在 ImageNet 64x64 上达到 6.20。当独立训练时，一致性模型成为一类新的生成模型，在 CIFAR-10、ImageNet 64x64 和 LSUN 256x256 等标准基准上的性能可以超越现有的单步非对抗性生成模型。

一致性模型

相似文章

改进的一致性模型训练技术

简化、稳定和扩展连续时间一致性模型

@jiqizhixin：如果只需要一步就能生成高质量图像，而不是数百步？斯坦福和字节跳动推出 W-Flow……

生成式模型

OpenAI新Images 2模型太强：角色完全一致，文字清晰不变

提交意见反馈