latent-planning

#latent-planning

Bernini: Latent Semantic Planning for Video Diffusion

Hugging Face Daily Papers ↗ · 2026-05-21 Cached

Bernini proposes a unified video generation and editing framework that combines multimodal large language models for semantic planning with diffusion models for pixel rendering, achieving state-of-the-art performance through semantic interface separation and enhanced positional embeddings.

0 favorites 0 likes

latent-planning

Bernini: Latent Semantic Planning for Video Diffusion

Submit Feedback