改进的一致性模型训练技术
摘要
OpenAI 展示了改进的一致性模型训练技术,无需蒸馏即可实现高质量单步图像生成,通过新型损失函数和训练策略在 CIFAR-10 和 ImageNet 64×64 上取得显著的 FID 改进。
一致性模型是一类新兴的生成模型,能够在一步内生成高质量数据,无需对抗训练。
查看缓存全文
缓存时间: 2026/04/20 14:54
# 改进的一致性模型训练技术
来源:https://openai.com/index/improved-techniques-for-training-consistency-models/
OpenAI
一致性模型是一类新兴的生成模型,能够在一步内采样出高质量数据,无需对抗训练。当前的一致性模型通过从预训练扩散模型蒸馏并采用 LPIPS 等学习指标来实现最优采样质量。然而,蒸馏会将一致性模型的质量限制在预训练扩散模型的水平,而 LPIPS 会在评估中引入不良偏差。为了解决这些挑战,我们提出了改进的一致性训练技术,使一致性模型能够直接从数据中学习,无需蒸馏。我们深入研究了一致性训练背后的理论,发现了一个之前被忽视的缺陷,并通过从教师一致性模型中消除指数移动平均来解决这个问题。为了替代 LPIPS 等学习指标,我们采用了来自鲁棒统计学的伪 Huber 损失函数。此外,我们为一致性训练目标引入了对数正态噪声调度,并提议在每次设定数量的训练迭代后将总离散化步数翻倍。结合更好的超参数调优,这些改进使一致性模型在单步采样中在 CIFAR-10 和 ImageNet 64×64 上分别达到 2.51 和 3.25 的 FID 分数。这些分数相比之前的一致性训练方法分别提高了 3.5 倍和 4 倍。通过两步采样,我们进一步将这两个数据集上的 FID 分数降低到 2.24 和 2.77,在单步和两步设置中都超越了蒸馏的结果,同时缩小了一致性模型与其他最先进生成模型之间的差距。
相似文章
一致性模型
OpenAI 推出一致性模型,这是一类新的生成模型,通过直接将噪声映射到数据,支持快速单步图像生成,同时支持多步采样和零次学习编辑任务(如图像修复和超分辨率)。该方法在 CIFAR-10 和 ImageNet 64x64 上的单步生成中实现了最先进的 FID 分数。
简化、稳定和扩展连续时间一致性模型
OpenAI 推出 sCM(简化连续时间一致性模型),这是一种新方法,可将一致性模型扩展至 1.5B 参数,通过仅 2 个采样步骤生成高质量样本,相比扩散模型实现约 50 倍的加速。该方法展示了与最先进扩散模型相当的样本质量,同时有效采样计算量不足 10%。
OpenAI新Images 2模型太强:角色完全一致,文字清晰不变
OpenAI发布升级图像模型,跨帧保持角色外观完美一致,文字清晰稳定。
@aiDotEngineer:规模化构建生成式图像与视频模型 https://youtube.com/watch?v=xOP1PM8fwnk… 图像生成最近热度很高!
@sedielem 在 YouTube 上的演讲,精炼地回顾了生成式图像与视频模型在规模化时的最新进展,涵盖建模、架构、蒸馏与控制。
微调 API 功能改进和自定义模型项目扩展
OpenAI 推出微调 API 的功能改进,包括基于轮次的检查点、用于模型评估的对比体验区、第三方集成和增强的仪表板功能。该公司还扩展了其自定义模型项目,为开发者提供更多对构建领域特定 AI 解决方案的控制和灵活性。