@CopyRebeldia：一家中国实验室刚刚羞辱了半个视频行业。你上传一张照片和一段音频，就能生成一个说话……

X AI KOLs Timeline 2026/05/30 16:49 工具

chinese-lab open-source avatar-generation talking-avatar video-tech ai-tool

摘要

一家中国实验室发布了LongCat-Avatar，这是一款开源工具，只需一张照片和一段音频，就能生成与音频同步的虚拟形象，彻底改变了视频制作方式。

一家中国实验室刚刚羞辱了半个视频行业。你上传一张照片和一段音频，就能得到一个同步说话的虚拟形象。开源。以前需要机构、摄像机和剪辑的工作，现在看起来就是一个仓库。它叫LongCat-Avatar。 https://t.co/Ui2l81tNYb

查看原文

查看缓存全文

缓存时间: 2026/05/31 07:04

一个中国实验室刚刚让半个视频行业颜面扫地。

上传一张照片和一段音频，就能生成一个同步说话的虚拟形象。开源。

以前需要摄影棚、摄像机、剪辑的活，现在看起来只是一个仓库。

它叫 LongCat-Avatar。

https://t.co/Ui2l81tNYb

相似文章

X AI KOLs Timeline

美团开源了LongCat-Video-Avatar-1.5模型，支持单张照片和语音生成逼真的说话视频，支持多语言、长视频，性能超越商业闭源方案。

Reddit r/LocalLLaMA

LongCat-Video-Avatar 1.5 是一个升级的开源框架，用于音频驱动的人像视频生成，具备更优的唇形同步、生产级稳定性及高效的8步推理能力。

X AI KOLs Following

LongCat 发布了一个开源说话头像模型（可能是最先进的），采用 MIT 许可，并提供了 Hugging Face 演示，可应用于 AI 导师、配音、编码智能体等多种场景。

X AI KOLs Following

LongCat 在 Hugging Face 上发布了一个开源视频数字人模型，可免费使用，并能实现令人印象深刻的效果。

X AI KOLs Timeline

介绍开源项目Pixelle-Video：一个全自动AI短视频引擎，输入主题即可自动生成带文案、配图、语音和背景音乐的视频，支持本地和云端模型，模块化设计可灵活替换各环节模型。