@MosiAI_Official: MOSS-TTS Local Transformer v1.5 现已推出。克隆任意声音。说任何语言。听到每一个细节。30多种语言，48 kHz …

X AI KOLs Following 2026/06/18 05:23 模型

text-to-speech voice-cloning multilingual transformer mosi-ai tts

摘要

MosiAI发布了MOSS-TTS Local Transformer v1.5，这是一款支持语音克隆、30多种语言以及48 kHz高质量输出的文本转语音模型。

MOSS-TTS Local Transformer v1.5 现已推出。克隆任意声音。说任何语言。听到每一个细节。 30多种语言，48 kHz清晰度。 https://t.co/BDUvgj6ZNK

查看原文

查看缓存全文

缓存时间: 2026/06/18 12:06

MOSS-TTS Local Transformer v1.5 来了。

克隆任意声音。说任何语言。听见每个细节。

30+ 种语言，48 kHz 清晰度。https://t.co/BDUvgj6ZNK

相似文章

X AI KOLs Timeline

MOSS-TTS-v1.5 是一个多语言可控 TTS 模型，支持语音克隆和长文本生成，以 20.6K 下载量登上 Hugging Face 热门排行榜第一名。

X AI KOLs Timeline

MOSS-TTS-Local Transformer v1.5 是一个开源的 48 kHz 立体声 TTS 模型，具有零样本语音克隆、原生流式传输，并支持31种语言，基于 Qwen3-4B 骨干网构建，通过 SGLang-Omni 提供。

Reddit r/LocalLLaMA

MOSS TTS 1.5是一款具备语音克隆功能的新款文本转语音模型，可通过Hugging Face Space使用。由于其开放许可协议，被认为优于Fish Audio S2 Pro。

Reddit r/LocalLLaMA

MOSS-TTS v1.5是一个更新的开源文本转语音模型，具有改进的多语言合成（支持31种语言）、更稳定的零样本语音克隆以及显式的内联停顿控制。

Hugging Face Models Trending

MOSS-TTS-Nano是一个开源的多语言语音生成模型，仅0.1B参数，专为实时TTS设计，可直接在CPU上运行而无需GPU。由OpenMOSS团队和MOSI.AI发布，它支持简单的本地部署，用于Web服务和产品集成。