@victormustar: 新消息:LongCat 刚刚发布了一个优秀的开源说话头像模型(可能是 SOTA)+ MIT 许可,制作了一个 Hugging F…
摘要
LongCat 发布了一个开源说话头像模型(可能是最先进的),采用 MIT 许可,并提供了 Hugging Face 演示,可应用于 AI 导师、配音、编码智能体等多种场景。
查看缓存全文
缓存时间: 2026/05/24 18:24
New: LongCat 刚刚发布了一个优秀的开源说话头像模型(可能是当前最先进的 SOTA)+ MIT 许可
我为此创建了一个 Hugging Face Space,效果非常惊人。可以用它构建很多很酷的产品:带人脸形象的 AI 导师、口型同步流水线、说话头像的编程助手(想象一下 Claude Code 加上一张脸)、NPC 对话等等……
下面分享 Hugging Face(免费)演示
Victor M (@victormustar): 做了个 AI 精灵,他总在监控我在干什么,狠狠吐槽我 😭😭
相似文章
meituan-longcat/LongCat-Video-Avatar-1.5 · Hugging Face
LongCat-Video-Avatar 1.5 是一个升级的开源框架,用于音频驱动的人像视频生成,具备更优的唇形同步、生产级稳定性及高效的8步推理能力。
@victormustar: https://x.com/victormustar/status/2059264598407033062
这篇文章描述了如何使用Hugging Face的ZeroGPU和一个编码代理,以有限的预算自主部署AI模型,特别是LongCat说话头像模型。
@Saboo_Shubham_: 太疯狂了……这是 Hugging Face 上免费提供的开源视频模型。LongCat 刚刚发布了一个令人惊叹的视频……
LongCat 在 Hugging Face 上发布了一个开源视频数字人模型,可免费使用,并能实现令人印象深刻的效果。
@hank_aibtc: https://x.com/victormustar/status/2058492201261244458/video/1… 我操!美团直接把商业闭源Avatar干翻了, 开源免费版LongCat-Video-Avatar-1.5来了! …
美团开源了LongCat-Video-Avatar-1.5模型,支持单张照片和语音生成逼真的说话视频,支持多语言、长视频,性能超越商业闭源方案。
Open-LLM-VTuber/Open-LLM-VTuber
Open-LLM-VTuber 是一个开源的语音交互AI伴侣,拥有Live2D虚拟形象,支持实时对话和视觉感知,可完全离线运行。