latent-planning

标签

Cards List
#latent-planning

Bernini:视频扩散的潜在语义规划

Hugging Face Daily Papers · 2026-05-21 缓存

Bernini 提出了一种统一的视频生成与编辑框架,将多模态大语言模型用于语义规划、扩散模型用于像素渲染,通过语义接口分离和增强位置编码实现最先进性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈