voice-synthesis

标签

Cards List
#voice-synthesis

@XAMTO_AI: 这个开源工具要是现在不收藏,将来肯定得后悔——视频自动配音翻译,一口气支持 33 种语言,还能直接对视频内容提问。 在 GitHub 上发现一个宝藏工具,叫 Violin,完全开源,做的事情说出来有点离谱:你把视频丢进去,它自动识别语音、…

X AI KOLs Timeline · 3天前 缓存

Violin 是一个开源的视频自动配音翻译工具,支持33种语言,集成Whisper、DeepSeek等模型,提供一键式语音识别、翻译、配音合成及视频内问答功能。

0 人收藏 0 人点赞
#voice-synthesis

Higgs Audio v3 TTS 4B。专为语音聊天打造。支持100种语言和内联控制。

Reddit r/LocalLLaMA · 2026-06-04

Higgs Audio v3 是一个 4B 参数的 TTS 模型,专为语音聊天应用设计,支持 100 种语言并具备内联控制能力。

0 人收藏 0 人点赞
#voice-synthesis

我开发了 Derpy Turtle:Kokoro 训练器,一个用于通过 RVC 训练更好 Kokoro 音色的 GUI

Reddit r/LocalLLaMA · 2026-05-12 缓存

Derpy Turtle 是一款 Windows GUI 工具,旨在通过整合音色搜索、RVC 模型训练和生成后音色转换,将工作流统一起来,从而增强 Kokoro 的语音输出效果。

1 人收藏 1 人点赞
#voice-synthesis

@shiri_shh:中国此刻正在发生的事:创业公司 Super Brain 只需 3 美元即可生成逝者基础 AI 克隆…

X AI KOLs Timeline · 2026-04-21 缓存

中国创业公司 Super Brain 利用照片、视频和语音记录,仅需 3 美元即可生成逝者 AI 克隆。

0 人收藏 0 人点赞
#voice-synthesis

openbmb/VoxCPM2

Hugging Face Models Trending · 2026-04-03 缓存

VoxCPM2 是一个开源的、无分词器的扩散自回归文本转语音模型,支持30种语言,拥有20亿参数,48kHz音频输出,并具备从自然语言描述进行语音设计、可控语音克隆以及实时流式处理等功能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈