@AdinaYakup: JD刚刚发布了JoyAI-Echo,一个有趣的长视频生成模型,5分钟多镜头视频生成,跨模态……
摘要
JD发布了JoyAI-Echo,这是一个长视频生成模型,能够生成5分钟多镜头视频,具备跨模态记忆实现角色和声音一致性,原生音视频生成,并通过DMD蒸馏技术实现7.5倍速度提升(无质量损失)。
JD刚刚发布了JoyAI-Echo 📹 一个有趣的长视频生成模型
✨ 5分钟多镜头视频生成
✨ 跨模态记忆,实现角色和声音一致性
✨ 原生音视频生成
✨ 通过DMD蒸馏技术实现7.5倍速度提升(无质量损失) https://t.co/qIel5Gc8qX
查看缓存全文
缓存时间: 2026/06/03 13:51
京东刚刚发布了 JoyAI-Echo 📹
一个有趣的长视频生成模型
✨ 5分钟多镜头视频生成
✨ 跨模态记忆,角色与语音一致性
✨ 原生音频 + 视频生成
✨ 通过 DMD 蒸馏实现 7.5 倍加速(无损画质)
https://t.co/qIel5Gc8qX
相似文章
jdopensource/JoyAI-Echo
京东开源发布了JoyAI-Echo(Echo-LongVideo),这是一个文本到音视频扩散模型,能够生成分钟级的多镜头视频,保持角色身份和声音一致,并利用DMD蒸馏实现了7.5倍的速度提升。
@LinusEkenstam:视频模型新突破
据报道,视频生成模型取得新突破,这可能标志着AI视频能力将迎来重大进展。
长视频生成(阅读时间 4 分钟)
本文介绍了 A²RD,这是一种利用智能体自回归扩散生成一致性长视频的新型架构。该架构提出了检索-合成-优化-更新(Retrieve–Synthesize–Refine–Update)循环机制,并推出了一个新的基准测试 LVBench-C,以解决长时视频合成中的语义漂移问题。
玩笑归玩笑,这个效果看起来和听起来都太棒了
一款新AI模型生成了令人印象深刻的逼真视频和音频,许多观察者都注意到其输出质量非常高。
我一直在为AI社区构建一些东西,希望能得到一些早期反馈。
Dhee 是一款新型智能视频生成AI,能够根据单一描述生成视频,自动处理提示词、图像生成与合成,并支持逐镜头编辑以进行精细调整。