frame-prediction

标签

Cards List
#frame-prediction

在视频生成的下一帧预测模型中打包输入帧上下文

Papers with Code Trending · 2025-04-17 缓存

FramePack是一种神经网络结构,它压缩输入帧,使得Transformer上下文长度固定,不受视频长度影响,从而使视频扩散模型能够处理大量帧,计算瓶颈类似于图像扩散,并提高了批量大小。它还引入了一种抗漂移采样方法,以减少曝光偏差。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈