@HuggingPapers: NVIDIA 刚刚在 Hugging Face 上发布了 AnyFlow 首个任意步数视频扩散模型,可生成高质量文本...

X AI KOLs Following 模型

摘要

NVIDIA 发布了 AnyFlow,这是首个用于文本到视频生成的任意步数视频扩散模型,允许在推理预算(4 到 50 步)之间实现平滑的质量缩放。

NVIDIA 刚刚在 Hugging Face 上发布了 AnyFlow 首个任意步数视频扩散模型,能够以任意推理预算(4 步或 50 步)生成高质量的文本到视频,质量平滑缩放而不会退化。https://t.co/bT6scg98ZT
查看原文
查看缓存全文

缓存时间: 2026/05/13 18:24

NVIDIA 刚刚在 Hugging Face 上发布了 AnyFlow

首个任意步数视频扩散模型,能在任意推理预算下生成高质量文本到视频——4步或50步,质量平滑扩展而不降级。https://t.co/bT6scg98ZT

相似文章

FlowLM: 基于扩散-流适配的少步语言建模

arXiv cs.CL

FlowLM 提出了一种流匹配语言模型,通过高效微调从预训练扩散模型衍生而来,能够实现高质量少步文本生成,其效果可与2000步扩散采样相媲美,而训练轮次更少。