Microsoft MAI-Voice-2
摘要
微软发布了 MAI-Voice-2,这是一款支持 15 种语言语音克隆的表现力丰富的文本转语音系统。
<p>
支持15种语言语音克隆的富有表现力的TTS系统
</p>
<p>
<a href="https://www.producthunt.com/products/mai-image-2-3?utm_campaign=producthunt-atom-posts-feed&utm_medium=rss-feed&utm_source=producthunt-atom-posts-feed">讨论</a>
|
<a href="https://www.producthunt.com/r/p/1163789?app_id=339">链接</a>
</p>
相似文章
k2-fsa/OmniVoice
OmniVoice 是一款大规模多语言零样本文本转语音模型,支持超过 600 种语言,基于扩散语言模型架构构建,具备快速推理和语音克隆能力。
Voiser AI
Voiser AI 提供超过140种语言的人性化AI配音。
@tom_doerr: 零样本语音克隆支持30种语言 https://github.com/sunnyxrxrx/X-Voice…
X-Voice 是一个基于流匹配的多语言文本转语音系统,支持跨30种语言的零样本语音克隆,并提供开源代码、模型及演示。
OpenMOSS-Team/MOSS-TTS-v1.5 · Hugging Face
MOSS-TTS v1.5是一个更新的开源文本转语音模型,具有改进的多语言合成(支持31种语言)、更稳定的零样本语音克隆以及显式的内联停顿控制。
@HowToAI_: ElevenLabs刚刚失去了护城河 有人开源了一款单一应用,可替代ElevenLabs和WisprFlow,且100%本地运行…
一款名为Voicebox的开源应用替代了ElevenLabs和WisprFlow,支持本地语音克隆、多种TTS引擎和MCP服务器,可在多种硬件上运行,采用MIT许可证。