voice-synthesis

#voice-synthesis

@XAMTO_AI: 这个开源工具要是现在不收藏，将来肯定得后悔——视频自动配音翻译，一口气支持 33 种语言，还能直接对视频内容提问。在 GitHub 上发现一个宝藏工具，叫 Violin，完全开源，做的事情说出来有点离谱：你把视频丢进去，它自动识别语音、…

X AI KOLs Timeline ↗ · 3天前缓存

Violin 是一个开源的视频自动配音翻译工具，支持33种语言，集成Whisper、DeepSeek等模型，提供一键式语音识别、翻译、配音合成及视频内问答功能。

0 人收藏 0 人点赞

#voice-synthesis

Reddit r/LocalLLaMA ↗ · 2026-06-04

Higgs Audio v3 是一个 4B 参数的 TTS 模型，专为语音聊天应用设计，支持 100 种语言并具备内联控制能力。

0 人收藏 0 人点赞

#voice-synthesis

Reddit r/LocalLLaMA ↗ · 2026-05-12 缓存

Derpy Turtle 是一款 Windows GUI 工具，旨在通过整合音色搜索、RVC 模型训练和生成后音色转换，将工作流统一起来，从而增强 Kokoro 的语音输出效果。

1 人收藏 1 人点赞

#voice-synthesis

X AI KOLs Timeline ↗ · 2026-04-21 缓存

中国创业公司 Super Brain 利用照片、视频和语音记录，仅需 3 美元即可生成逝者 AI 克隆。

0 人收藏 0 人点赞

#voice-synthesis

Hugging Face Models Trending ↗ · 2026-04-03 缓存

VoxCPM2 是一个开源的、无分词器的扩散自回归文本转语音模型，支持30种语言，拥有20亿参数，48kHz音频输出，并具备从自然语言描述进行语音设计、可控语音克隆以及实时流式处理等功能。

0 人收藏 0 人点赞