@CopyRebeldia:一家中国实验室刚刚羞辱了半个视频行业。你上传一张照片和一段音频,就能生成一个说话……
摘要
一家中国实验室发布了LongCat-Avatar,这是一款开源工具,只需一张照片和一段音频,就能生成与音频同步的虚拟形象,彻底改变了视频制作方式。
一家中国实验室刚刚羞辱了半个视频行业。
你上传一张照片和一段音频,就能得到一个同步说话的虚拟形象。开源。
以前需要机构、摄像机和剪辑的工作,现在看起来就是一个仓库。
它叫LongCat-Avatar。
https://t.co/Ui2l81tNYb
查看缓存全文
缓存时间: 2026/05/31 07:04
一个中国实验室刚刚让半个视频行业颜面扫地。
上传一张照片和一段音频,就能生成一个同步说话的虚拟形象。开源。
以前需要摄影棚、摄像机、剪辑的活,现在看起来只是一个仓库。
它叫 LongCat-Avatar。
https://t.co/Ui2l81tNYb
相似文章
@hank_aibtc: https://x.com/victormustar/status/2058492201261244458/video/1… 我操!美团直接把商业闭源Avatar干翻了, 开源免费版LongCat-Video-Avatar-1.5来了! …
美团开源了LongCat-Video-Avatar-1.5模型,支持单张照片和语音生成逼真的说话视频,支持多语言、长视频,性能超越商业闭源方案。
meituan-longcat/LongCat-Video-Avatar-1.5 · Hugging Face
LongCat-Video-Avatar 1.5 是一个升级的开源框架,用于音频驱动的人像视频生成,具备更优的唇形同步、生产级稳定性及高效的8步推理能力。
@victormustar: 新消息:LongCat 刚刚发布了一个优秀的开源说话头像模型(可能是 SOTA)+ MIT 许可,制作了一个 Hugging F…
LongCat 发布了一个开源说话头像模型(可能是最先进的),采用 MIT 许可,并提供了 Hugging Face 演示,可应用于 AI 导师、配音、编码智能体等多种场景。
@Saboo_Shubham_: 太疯狂了……这是 Hugging Face 上免费提供的开源视频模型。LongCat 刚刚发布了一个令人惊叹的视频……
LongCat 在 Hugging Face 上发布了一个开源视频数字人模型,可免费使用,并能实现令人印象深刻的效果。
Google让你轻松制作自己的深度伪造视频
谷歌在其Flow工具中推出了新的'虚拟化身'功能,允许用户使用Omni Flash模型创建自己的数字克隆,并将其插入到AI生成的视频中。