long-range-consistency

标签

Cards List
#long-range-consistency

MilliVid:用于视频生成中长程一致性的分层潜在变量

Hugging Face Daily Papers · 2026-06-08 缓存

本文介绍了MilliVid,一种通过使用多尺度自编码器将帧压缩为分层标记,然后使用由粗到细的扩散模型生成它们,从而提升视频生成中长程一致性的方法,在Minecraft视频上超越了基线模型。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈