AnyFlow:基于在策略流图蒸馏的任意步长视频扩散模型

Hugging Face Daily Papers 论文

摘要

AnyFlow 提出了一种新颖的任意步长视频扩散蒸馏框架,通过流图过渡学习和反向模拟优化完整的 ODE 采样轨迹,在匹配甚至超越基于一致性模型的同时,能够随采样步数预算进行扩展。

少步视频生成已通过一致性蒸馏取得了显著进展。然而,一致性蒸馏模型在测试时分配更多采样步数时性能往往会下降,限制了它们在任意步长视频扩散中的有效性。这一局限性源于一致性蒸馏将原始概率流 ODE 轨迹替换为一致性采样轨迹,从而削弱了 ODE 采样在测试时理想的可扩展性。为解决这一问题,我们提出了 AnyFlow,这是首个基于流图的任意步长视频扩散蒸馏框架。与仅针对少数固定采样步骤进行蒸馏不同,AnyFlow 优化了完整的 ODE 采样轨迹。为此,我们将蒸馏目标从端点一致性映射(z_{t}→z_{0})转变为任意时间间隔上的流图过渡学习(z_{t}→z_{r})。我们进一步提出了流图反向模拟,将完整的 Euler 展开分解为快捷的流图过渡,从而实现高效的在策略蒸馏,减少了测试时的误差(即少步采样中的离散化误差和因果生成中的曝光偏差)。在双向和因果架构上,从 1.3B 到 14B 参数规模的大量实验表明,AnyFlow 在少步采样场景下达到了匹配或超越基于一致性模型的表现,并且能够随采样步数预算进行扩展。
查看原文
查看缓存全文

缓存时间: 2026/05/14 04:17

论文页面 - AnyFlow: 基于同策略流映射蒸馏的任意步数视频扩散模型

来源: https://huggingface.co/papers/2605.13724

摘要

AnyFlow 提出了一种新颖的任意步数视频扩散蒸馏框架,它通过流映射过渡学习和反向模拟技术优化完整的 ODE 采样轨迹,从而改进了一致性蒸馏。

少步视频生成(https://huggingface.co/papers?q=video%20generation) 已通过一致性蒸馏(https://huggingface.co/papers?q=consistency%20distillation) 取得显著进展。然而,一致性蒸馏模型在测试时分配更多采样步数时,性能往往会下降,这限制了其在任意步数视频扩散中的有效性。此局限性源于一致性蒸馏(https://huggingface.co/papers?q=consistency%20distillation) 将原始概率流 ODE 轨迹替换为一致性采样轨迹,削弱了 ODE 采样(https://huggingface.co/papers?q=ODE%20sampling) 令人期望的测试时扩展行为。为解决此问题,我们引入了 AnyFlow,这是首个基于流映射(https://huggingface.co/papers?q=flow%20maps) 的任意步数视频扩散蒸馏框架。AnyFlow 并非仅针对少数固定采样步数蒸馏模型,而是优化完整的 ODE 采样(https://huggingface.co/papers?q=ODE%20sampling) 轨迹。为此,我们将蒸馏目标从端点一致性映射 (zₜ → z₀) 转变为任意时间间隔上的流映射过渡学习 (zₜ → zᵣ)。我们进一步提出了流映射反向模拟,它将完整的欧拉展开(https://huggingface.co/papers?q=Euler%20rollout) 分解为捷径流映射过渡,从而实现高效的同策略蒸馏(https://huggingface.co/papers?q=on-policy%20distillation),减少测试时误差(即少步采样中的离散化误差(https://huggingface.co/papers?q=discretization%20error) 和因果生成(https://huggingface.co/papers?q=causal%20generation) 中的曝光偏差(https://huggingface.co/papers?q=exposure%20bias))。在双向和因果架构上,从 1.3B 到 14B 参数规模的广泛实验表明,AnyFlow 在少步场景下性能达到或超越基于一致性的方法,并且随着采样步数预算的增加而扩展。

查看 arXiv 页面 (https://arxiv.org/abs/2605.13724) 查看 PDF (https://arxiv.org/pdf/2605.13724) 项目页面 (https://nvlabs.github.io/AnyFlow/) GitHub (https://github.com/NVlabs/AnyFlow) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.13724)

引用此论文的模型0

无模型关联此论文

请在模型 README.md 中引用 arxiv.org/abs/2605.13724 以从此页面关联。

引用此论文的数据集0

无数据集关联此论文

请在数据集 README.md 中引用 arxiv.org/abs/2605.13724 以从此页面关联。

引用此论文的 Space0

无 Space 关联此论文

请在 Space README.md 中引用 arxiv.org/abs/2605.13724 以从此页面关联。

包含此论文的收藏集0

无收藏集包含此论文

请将此论文添加至收藏集(https://huggingface.co/new-collection)以从此页面关联。

相似文章

Flow-OPD:用于流匹配模型的对策蒸馏

Hugging Face Daily Papers

Flow-OPD 是一篇研究论文,介绍了一种用于流匹配文生图模型的两阶段对策蒸馏框架。基于 Stable Diffusion 3.5 Medium,该框架显著提升了生成质量和对齐指标。

FlowLM: 基于扩散-流适配的少步语言建模

arXiv cs.CL

FlowLM 提出了一种流匹配语言模型,通过高效微调从预训练扩散模型衍生而来,能够实现高质量少步文本生成,其效果可与2000步扩散采样相媲美,而训练轮次更少。