NVlabs/Sana

GitHub Trending (daily) 模型

摘要

NVlabs/Sana是一个面向效率的开源代码库,用于高分辨率图像和视频生成,包含多个模型变体及训练/推理管线。

SANA:基于线性扩散变压器的高效高分辨率图像合成
查看原文
查看缓存全文

缓存时间: 2026/05/18 12:33

📚 文档 | SANA | SANA-1.5 | SANA-Sprint | SANA-Video | SANA-WM | Sol-RL 演示 | 🤗 HuggingFace | ComfyUI | SGLang | Cosmos-RL

ICLR 2025 口头报告 | ICML 2025 | ICCV 2025 亮点 | ICLR 2026 口头报告

相似文章

Efficient-Large-Model/SANA-WM_bidirectional

Hugging Face Models Trending

SANA-WM 是一个高效的 2.6B 参数开源世界模型,用于分钟级视频生成并具备精确的相机控制。它采用混合线性扩散变换器和两阶段流水线,从图像和文本提示生成 720p 视频。