multi-shot

#multi-shot

jdopensource/JoyAI-Echo

Hugging Face Models Trending ↗ · 2026-06-02 缓存

京东开源发布了JoyAI-Echo（Echo-LongVideo），这是一个文本到音视频扩散模型，能够生成分钟级的多镜头视频，保持角色身份和声音一致，并利用DMD蒸馏实现了7.5倍的速度提升。

0 人收藏 0 人点赞

#multi-shot

Hugging Face Daily Papers ↗ · 2026-05-19 缓存

MSAVBench是首个面向多镜头音视频生成的综合基准与自适应评估框架，评估了19个模型在多样化任务上的表现，并与人类判断实现了高度对齐。

0 人收藏 0 人点赞