@AdinaYakup: JD刚刚发布了JoyAI-Echo,一个有趣的长视频生成模型,5分钟多镜头视频生成,跨模态……

X AI KOLs Following 模型

摘要

JD发布了JoyAI-Echo,这是一个长视频生成模型,能够生成5分钟多镜头视频,具备跨模态记忆实现角色和声音一致性,原生音视频生成,并通过DMD蒸馏技术实现7.5倍速度提升(无质量损失)。

JD刚刚发布了JoyAI-Echo 📹 一个有趣的长视频生成模型 ✨ 5分钟多镜头视频生成 ✨ 跨模态记忆,实现角色和声音一致性 ✨ 原生音视频生成 ✨ 通过DMD蒸馏技术实现7.5倍速度提升(无质量损失) https://t.co/qIel5Gc8qX
查看原文
查看缓存全文

缓存时间: 2026/06/03 13:51

京东刚刚发布了 JoyAI-Echo 📹
一个有趣的长视频生成模型

✨ 5分钟多镜头视频生成
✨ 跨模态记忆,角色与语音一致性
✨ 原生音频 + 视频生成
✨ 通过 DMD 蒸馏实现 7.5 倍加速(无损画质)
https://t.co/qIel5Gc8qX

相似文章

jdopensource/JoyAI-Echo

Hugging Face Models Trending

京东开源发布了JoyAI-Echo(Echo-LongVideo),这是一个文本到音视频扩散模型,能够生成分钟级的多镜头视频,保持角色身份和声音一致,并利用DMD蒸馏实现了7.5倍的速度提升。

长视频生成(阅读时间 4 分钟)

TLDR AI

本文介绍了 A²RD,这是一种利用智能体自回归扩散生成一致性长视频的新型架构。该架构提出了检索-合成-优化-更新(Retrieve–Synthesize–Refine–Update)循环机制,并推出了一个新的基准测试 LVBench-C,以解决长时视频合成中的语义漂移问题。