voice-synthesis

标签

Cards List
#voice-synthesis

Higgs Audio v3 TTS 4B。专为语音聊天打造。支持100种语言和内联控制。

Reddit r/LocalLLaMA · 昨天

Higgs Audio v3 是一个 4B 参数的 TTS 模型,专为语音聊天应用设计,支持 100 种语言并具备内联控制能力。

0 人收藏 0 人点赞
#voice-synthesis

我开发了 Derpy Turtle:Kokoro 训练器,一个用于通过 RVC 训练更好 Kokoro 音色的 GUI

Reddit r/LocalLLaMA · 2026-05-12 缓存

Derpy Turtle 是一款 Windows GUI 工具,旨在通过整合音色搜索、RVC 模型训练和生成后音色转换,将工作流统一起来,从而增强 Kokoro 的语音输出效果。

1 人收藏 1 人点赞
#voice-synthesis

@shiri_shh:中国此刻正在发生的事:创业公司 Super Brain 只需 3 美元即可生成逝者基础 AI 克隆…

X AI KOLs Timeline · 2026-04-21 缓存

中国创业公司 Super Brain 利用照片、视频和语音记录,仅需 3 美元即可生成逝者 AI 克隆。

0 人收藏 0 人点赞
#voice-synthesis

openbmb/VoxCPM2

Hugging Face Models Trending · 2026-04-03 缓存

VoxCPM2 是一个开源的、无分词器的扩散自回归文本转语音模型,支持30种语言,拥有20亿参数,48kHz音频输出,并具备从自然语言描述进行语音设计、可控语音克隆以及实时流式处理等功能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈