audio-video-generation

#audio-video-generation

MSAVBench：迈向多镜头音视频生成的全面可靠评估

Hugging Face Daily Papers ↗ · 2026-05-19 缓存

MSAVBench是首个面向多镜头音视频生成的综合基准与自适应评估框架，评估了19个模型在多样化任务上的表现，并与人类判断实现了高度对齐。

0 人收藏 0 人点赞

#audio-video-generation

GitHub Trending (daily) ↗ · 2026-06-18 缓存

LTX-2 是 Lightricks 推出的首个基于 DiT 的音频-视频基础模型，提供同步音频和视频生成、高保真度以及可投入生产的输出，并附带开源代码和开放模型权重。

0 人收藏 0 人点赞