面向自回归视频生成的在线策略对抗流蒸馏

Hugging Face Daily Papers 论文

摘要

提出对抗流蒸馏(AFD),用于将异质黑盒视频生成模型蒸馏为自回归学生模型,采用在线策略反馈和前向过程流匹配更新。

自回归视频生成器在流式、长程和交互式应用中具有吸引力,但将强大的黑盒教师模型蒸馏为因果学生模型仍然困难。学生必须在其自身的rollout分布下学习,而实际教师可能只暴露提示条件化的完整视频,并且在架构、容量、时序设计和采样调度上可能不同。这种接口使得监督微调是离线的,基于分数的蒸馏不适用,而直接对抗模仿对于去噪时的信用分配过于稀疏。我们提出对抗流蒸馏(AFD),一个用于异质黑盒视频蒸馏的在线策略框架。AFD查询教师并在相同的提示上展开当前学生,训练一个提示配对的Bradley-Terry判别器来估计干净样本的教师-学生差异,并将得到的在线策略优势转化为对学生自身噪声状态的前向过程流匹配更新。因此,AFD提供密集的速度场监督,同时不需要教师分数、潜在变量、去噪轨迹、步对齐或反向链强化学习。在两个因果AR学生家族上的实验表明,AFD持续改进运动敏感和物理敏感的生成,同时保持一般视频质量,消融实验验证了自适应在线策略反馈和前向过程信用分配的重要性。该方法仅需要干净的教师视频和学生rollout,为将专有或异质视频生成器蒸馏为高效自回归学生提供了实用途径。
查看原文
查看缓存全文

缓存时间: 2026/05/26 06:42

论文页面 - 基于策略的对抗性流蒸馏用于自回归视频生成

来源:https://huggingface.co/papers/2605.26105

摘要

对抗性流蒸馏通过利用基于策略的反馈和前向过程流匹配更新,无需教师评分或详细轨迹信息,即可实现对异构视频生成模型的高效蒸馏。

自回归视频生成器(https://huggingface.co/papers?q=Autoregressive%20video%20generators)在流式传输、长序列和交互式应用中颇具吸引力,但将强大的黑盒教师(https://huggingface.co/papers?q=black-box%20teachers)蒸馏到因果学生模型(https://huggingface.co/papers?q=causal%20students)中仍然困难重重。学生必须在其自身的 rollout 分布下学习,而实际中的教师可能仅暴露基于提示的已完成视频,并且在架构、容量、时间设计和采样调度上也可能有所不同。这种接口使得监督微调变为离策略、基于分数的蒸馏不再适用,且直接对抗模仿对于去噪时段的信用分配显得过于稀疏。我们提出了对抗性流蒸馏(AFD),一个面向异构黑盒视频蒸馏(https://huggingface.co/papers?q=video%20distillation)的基于策略框架(https://huggingface.co/papers?q=on-policy%20framework)。AFD 向教师查询并在相同提示上对当前学生进行 rollout,训练一个配对提示的 Bradley-Terry 判别器(https://huggingface.co/papers?q=Bradley-Terry%20discriminator)来估计干净样本上的师生差异,并将由此得到的基于策略优势转化为学生自身噪声状态上的前向过程流匹配更新(https://huggingface.co/papers?q=flow-matching%20updates)。因此,AFD 提供了密集的速度场监督,同时无需教师评分、隐变量、去噪轨迹、步长对齐或反向链强化学习。在两个因果 AR 学生族上的实验表明,AFD 在保持通用视频质量的同时,持续提升了运动敏感和物理敏感视频的生成质量;消融实验验证了自适应基于策略反馈和前向过程信用分配(https://huggingface.co/papers?q=forward-process%20credit%20assignment)的重要性。该方法仅需要干净的教师视频和学生 rollout,为将专有或异构视频生成器蒸馏为高效自回归学生提供了一条实用路径。

查看 arXiv 页面(https://arxiv.org/abs/2605.26105)查看 PDF(https://arxiv.org/pdf/2605.26105)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2605.26105)

将这篇论文载入你的代理:

hf papers read 2605.26105

没有最新 CLI?curl -LsSf https://hf.co/cli/install.sh | bash

引用该论文的模型0

没有模型关联该论文

请在模型 README.md 中引用 arxiv.org/abs/2605.26105,以便从本页链接。

引用该论文的数据集0

没有数据集关联该论文

请在数据集 README.md 中引用 arxiv.org/abs/2605.26105,以便从本页链接。

引用该论文的 Spaces0

没有空间关联该论文

请在 Space README.md 中引用 arxiv.org/abs/2605.26105,以便从本页链接。

包含该论文的集合0

没有集合包含该论文

请将此论文添加到一个集合(https://huggingface.co/new-collection)中,以便从本页链接。

相似文章

Flow-OPD:用于流匹配模型的对策蒸馏

Hugging Face Daily Papers

Flow-OPD 是一篇研究论文,介绍了一种用于流匹配文生图模型的两阶段对策蒸馏框架。基于 Stable Diffusion 3.5 Medium,该框架显著提升了生成质量和对齐指标。