One-Forcing: 迈向稳定的单步自回归视频生成

Hugging Face Daily Papers 论文

摘要

One-Forcing 通过用辅助 GAN 损失增强 DMD 目标,改进了单步视频生成,以更低的训练成本实现了最先进的性能。

近期进展显著提升了自回归框架下的实时交互式视频生成。然而,大多数现有的少步自回归视频生成方法,通常从对应的多步教师模型中蒸馏而来,默认采用4步采样配置,在部署时仍然存在较大延迟,并且当采样步数进一步减少(尤其是在单步设置下)时,会出现严重的质量下降。轨迹式一致性蒸馏方法通常生成的视频动态性较弱,而基于DMD的方法(如Self-Forcing)则往往产生模糊的帧。为了解决这一挑战,我们提出了One-Forcing,一种简单而有效的方法,通过添加辅助GAN损失来增强DMD目标,以实现高质量且高效的单步视频生成。在VBench上的实验表明,One-Forcing取得了83.76的总分,在单步因果视频生成方法中达到了最先进的性能,并与强大的多步方法保持竞争力。我们进一步证明,仅需分块模型三分之一的训练成本,即可稳定实现单步逐帧自回归生成,而先前的方法未能成功实现这一设置。
查看原文
查看缓存全文

缓存时间: 2026/06/01 19:21

论文页面 - One-Forcing: 迈向稳定的单步自回归视频生成

来源: https://huggingface.co/papers/2605.23458

摘要

One-Forcing 通过将 DMD 目标与 GAN 损失相结合,提升了单步视频生成的质量和效率,以更低的训练成本取得了最先进的结果。

近期进展显著提升了自回归模式下实时交互式视频生成的质量。然而,现有的大多数少步自回归视频生成 (https://huggingface.co/papers?q=autoregressive%20video%20generation) 方法(通常从对应的多步教师模型蒸馏而来)默认采用 4 步采样配置,这在部署时仍会导致相当大的延迟,并且当采样步数进一步减少(尤其是在单步设置下)时,会出现严重的质量退化。轨迹式一致性蒸馏 (https://huggingface.co/papers?q=Trajectory-style%20consistency%20distillation) 方法通常生成的视频动态性较弱,而基于 DMD (https://huggingface.co/papers?q=DMD-based%20approaches) 的方法(例如 Self-Forcing (https://huggingface.co/papers?q=Self-Forcing))则倾向于产生模糊的帧。为了解决这一挑战,我们提出了 One-Forcing,一种简单而有效的方法,它通过辅助的 GAN 损失 (https://huggingface.co/papers?q=GAN%20loss) 来增强 DMD 目标,以实现高质量且高效的单步视频生成 (https://huggingface.co/papers?q=one-step%20video%20generation)。在 VBench 上的实验表明,One-Forcing 的总分达到 83.76,在单步因果视频生成 (https://huggingface.co/papers?q=causal%20video%20generation) 方法中建立了最先进的性能,并与强大的多步方法保持竞争力。我们进一步证明,仅需分块模型 (https://huggingface.co/papers?q=chunkwise%20model) 三分之一的训练成本,即可稳定实现单步逐帧自回归生成,而先前的方案未能成功达成这一设置。

查看 arXiv 页面 (https://arxiv.org/abs/2605.23458)查看 PDF (https://arxiv.org/pdf/2605.23458)项目页面 (https://aurora-edu.github.io/one-forcing/)GitHub30 (https://github.com/Aurora-edu/One-Forcing)添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.23458)

在你的代理中获取此论文:

hf papers read 2605\.23458

没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型0

没有模型关联此论文

请在模型 README.md 中引用 arxiv.org/abs/2605.23458 以在此页面建立链接。

引用此论文的数据集0

没有数据集关联此论文

请在数据集 README.md 中引用 arxiv.org/abs/2605.23458 以在此页面建立链接。

引用此论文的 Space0

没有 Space 关联此论文

请在 Space README.md 中引用 arxiv.org/abs/2605.23458 以在此页面建立链接。

包含此论文的收藏集0

没有收藏集包含此论文

请将此论文添加到一个收藏集 (https://huggingface.co/new-collection) 以在此页面建立链接。

相似文章

流式力控视频生成

Hugging Face Daily Papers

StreamForce 是一种因果统一视频生成模型,通过蒸馏流水线和自回归架构,为时变力提供实时、基于物理的响应,在力的遵循度和运动真实性方面达到了最先进的性能。