voice-synthesis

#voice-synthesis

Higgs Audio v3 TTS 4B。专为语音聊天打造。支持100种语言和内联控制。

Reddit r/LocalLLaMA ↗ · 昨天

Higgs Audio v3 是一个 4B 参数的 TTS 模型，专为语音聊天应用设计，支持 100 种语言并具备内联控制能力。

0 人收藏 0 人点赞

#voice-synthesis

Reddit r/LocalLLaMA ↗ · 2026-05-12 缓存

Derpy Turtle 是一款 Windows GUI 工具，旨在通过整合音色搜索、RVC 模型训练和生成后音色转换，将工作流统一起来，从而增强 Kokoro 的语音输出效果。

1 人收藏 1 人点赞

#voice-synthesis

X AI KOLs Timeline ↗ · 2026-04-21 缓存

中国创业公司 Super Brain 利用照片、视频和语音记录，仅需 3 美元即可生成逝者 AI 克隆。

0 人收藏 0 人点赞

#voice-synthesis

Hugging Face Models Trending ↗ · 2026-04-03 缓存

VoxCPM2 是一个开源的、无分词器的扩散自回归文本转语音模型，支持30种语言，拥有20亿参数，48kHz音频输出，并具备从自然语言描述进行语音设计、可控语音克隆以及实时流式处理等功能。

0 人收藏 0 人点赞