@AdinaYakup: JD刚刚发布了JoyAI-Echo，一个有趣的长视频生成模型，5分钟多镜头视频生成，跨模态……

X AI KOLs Following 2026/06/03 08:30 模型

video-generation ai-model text-to-video cross-modal joyai-echo jd

摘要

JD发布了JoyAI-Echo，这是一个长视频生成模型，能够生成5分钟多镜头视频，具备跨模态记忆实现角色和声音一致性，原生音视频生成，并通过DMD蒸馏技术实现7.5倍速度提升（无质量损失）。

JD刚刚发布了JoyAI-Echo 📹 一个有趣的长视频生成模型 ✨ 5分钟多镜头视频生成 ✨ 跨模态记忆，实现角色和声音一致性 ✨ 原生音视频生成 ✨ 通过DMD蒸馏技术实现7.5倍速度提升（无质量损失） https://t.co/qIel5Gc8qX

查看原文

查看缓存全文

缓存时间: 2026/06/03 13:51

京东刚刚发布了 JoyAI-Echo 📹
一个有趣的长视频生成模型

✨ 5分钟多镜头视频生成
✨ 跨模态记忆，角色与语音一致性
✨ 原生音频 + 视频生成
✨ 通过 DMD 蒸馏实现 7.5 倍加速（无损画质）
https://t.co/qIel5Gc8qX

相似文章

Hugging Face Models Trending

京东开源发布了JoyAI-Echo（Echo-LongVideo），这是一个文本到音视频扩散模型，能够生成分钟级的多镜头视频，保持角色身份和声音一致，并利用DMD蒸馏实现了7.5倍的速度提升。

X AI KOLs Following

据报道，视频生成模型取得新突破，这可能标志着AI视频能力将迎来重大进展。

TLDR AI

本文介绍了 A²RD，这是一种利用智能体自回归扩散生成一致性长视频的新型架构。该架构提出了检索-合成-优化-更新（Retrieve–Synthesize–Refine–Update）循环机制，并推出了一个新的基准测试 LVBench-C，以解决长时视频合成中的语义漂移问题。

Reddit r/singularity

一款新AI模型生成了令人印象深刻的逼真视频和音频，许多观察者都注意到其输出质量非常高。

Reddit r/AI_Agents

Dhee 是一款新型智能视频生成AI，能够根据单一描述生成视频，自动处理提示词、图像生成与合成，并支持逐镜头编辑以进行精细调整。