multi-shot

标签

Cards List
#multi-shot

jdopensource/JoyAI-Echo

Hugging Face Models Trending · 2026-06-02 缓存

京东开源发布了JoyAI-Echo(Echo-LongVideo),这是一个文本到音视频扩散模型,能够生成分钟级的多镜头视频,保持角色身份和声音一致,并利用DMD蒸馏实现了7.5倍的速度提升。

0 人收藏 0 人点赞
#multi-shot

MSAVBench:迈向多镜头音视频生成的全面可靠评估

Hugging Face Daily Papers · 2026-05-19 缓存

MSAVBench是首个面向多镜头音视频生成的综合基准与自适应评估框架,评估了19个模型在多样化任务上的表现,并与人类判断实现了高度对齐。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈