面向自回归视频生成的在线策略对抗流蒸馏
摘要
提出对抗流蒸馏(AFD),用于将异质黑盒视频生成模型蒸馏为自回归学生模型,采用在线策略反馈和前向过程流匹配更新。
查看缓存全文
缓存时间: 2026/05/26 06:42
论文页面 - 基于策略的对抗性流蒸馏用于自回归视频生成
来源:https://huggingface.co/papers/2605.26105
摘要
对抗性流蒸馏通过利用基于策略的反馈和前向过程流匹配更新,无需教师评分或详细轨迹信息,即可实现对异构视频生成模型的高效蒸馏。
自回归视频生成器(https://huggingface.co/papers?q=Autoregressive%20video%20generators)在流式传输、长序列和交互式应用中颇具吸引力,但将强大的黑盒教师(https://huggingface.co/papers?q=black-box%20teachers)蒸馏到因果学生模型(https://huggingface.co/papers?q=causal%20students)中仍然困难重重。学生必须在其自身的 rollout 分布下学习,而实际中的教师可能仅暴露基于提示的已完成视频,并且在架构、容量、时间设计和采样调度上也可能有所不同。这种接口使得监督微调变为离策略、基于分数的蒸馏不再适用,且直接对抗模仿对于去噪时段的信用分配显得过于稀疏。我们提出了对抗性流蒸馏(AFD),一个面向异构黑盒视频蒸馏(https://huggingface.co/papers?q=video%20distillation)的基于策略框架(https://huggingface.co/papers?q=on-policy%20framework)。AFD 向教师查询并在相同提示上对当前学生进行 rollout,训练一个配对提示的 Bradley-Terry 判别器(https://huggingface.co/papers?q=Bradley-Terry%20discriminator)来估计干净样本上的师生差异,并将由此得到的基于策略优势转化为学生自身噪声状态上的前向过程流匹配更新(https://huggingface.co/papers?q=flow-matching%20updates)。因此,AFD 提供了密集的速度场监督,同时无需教师评分、隐变量、去噪轨迹、步长对齐或反向链强化学习。在两个因果 AR 学生族上的实验表明,AFD 在保持通用视频质量的同时,持续提升了运动敏感和物理敏感视频的生成质量;消融实验验证了自适应基于策略反馈和前向过程信用分配(https://huggingface.co/papers?q=forward-process%20credit%20assignment)的重要性。该方法仅需要干净的教师视频和学生 rollout,为将专有或异构视频生成器蒸馏为高效自回归学生提供了一条实用路径。
查看 arXiv 页面(https://arxiv.org/abs/2605.26105)查看 PDF(https://arxiv.org/pdf/2605.26105)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2605.26105)
将这篇论文载入你的代理:
hf papers read 2605.26105
没有最新 CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用该论文的模型0
没有模型关联该论文
请在模型 README.md 中引用 arxiv.org/abs/2605.26105,以便从本页链接。
引用该论文的数据集0
没有数据集关联该论文
请在数据集 README.md 中引用 arxiv.org/abs/2605.26105,以便从本页链接。
引用该论文的 Spaces0
没有空间关联该论文
请在 Space README.md 中引用 arxiv.org/abs/2605.26105,以便从本页链接。
包含该论文的集合0
没有集合包含该论文
请将此论文添加到一个集合(https://huggingface.co/new-collection)中,以便从本页链接。
相似文章
AAD-1:一步自回归视频生成的非对称对抗性蒸馏
AAD-1 引入具有分阶段训练的非对称对抗性蒸馏,以实现一步自回归视频生成,在 VBench 上优于先前方法。
AnyFlow:基于在策略流图蒸馏的任意步长视频扩散模型
AnyFlow 提出了一种新颖的任意步长视频扩散蒸馏框架,通过流图过渡学习和反向模拟优化完整的 ODE 采样轨迹,在匹配甚至超越基于一致性模型的同时,能够随采样步数预算进行扩展。
Causal Forcing++:可扩展的少步自回归扩散蒸馏,用于实时交互式视频生成
Causal Forcing++提出了一种新颖的因果一致性蒸馏方法,用于逐帧自回归视频生成,在降低延迟和训练成本的同时实现了最先进的质量。
Flow-OPD:用于流匹配模型的对策蒸馏
Flow-OPD 是一篇研究论文,介绍了一种用于流匹配文生图模型的两阶段对策蒸馏框架。基于 Stable Diffusion 3.5 Medium,该框架显著提升了生成质量和对齐指标。
One-Forcing: 迈向稳定的单步自回归视频生成
One-Forcing 通过用辅助 GAN 损失增强 DMD 目标,改进了单步视频生成,以更低的训练成本实现了最先进的性能。