@billtheinvestor: 上海交通大学开源 F5-TTS 语音生成模型。该模型基于 10 万小时数据训练，支持中英多语言合成。技术特性包含 Zero-shot 声音克隆、基于总时长的速度控制、情感表现控制及长文本合成。支持商用。

X AI KOLs Timeline 2026/05/08 01:09 模型

摘要

上海交通大学开源了 F5-TTS 语音生成模型，该模型基于 10 万小时数据训练，支持中英多语言合成及 Zero-shot 声音克隆，并允许商用。

上海交通大学开源 F5-TTS 语音生成模型。该模型基于 10 万小时数据训练，支持中英多语言合成。技术特性包含 Zero-shot 声音克隆、基于总时长的速度控制、情感表现控制及长文本合成。支持商用。 https://t.co/G8rSolPdVh

查看原文

查看缓存全文

缓存时间: 2026/05/08 09:53

相似文章

@Chenzeze777: 发现一个开源的语音合成模型，不说一声实在过意不去。 20 亿参数，200 万小时数据训练，30 种语言+9 种中国方言直接输入文本就合成，连四川话粤语东北话都有。最离谱的是什么？你用自然语言描述音色——「年轻女性，温柔甜美」——它就给…

X AI KOLs Timeline

介绍了一个开源的语音合成模型，20亿参数、200万小时训练，支持30种语言和9种中国方言，可用自然语言描述音色，3秒录音即可克隆声音，音质达48kHz，Apache-2.0协议免费商用。

@Honcia13: 开源TTS直接卷疯了！园区诈骗又有新武器？清华 OpenBMB 刚刚放出 VoxCPM2： 200亿参数 + 200万小时多语言数据训练，48kHz录音棚级音质！最狠的是——完全不用Tokenizer，直接在连续潜空间做扩散自回归，细…

X AI KOLs Timeline

清华大学 OpenBMB 发布了 VoxCPM2，这是一个拥有 200 亿参数的开源多语言 TTS 模型，支持无需 Tokenizer 的连续潜空间扩散自回归生成，具备 48kHz 录音棚级音质和强大的声音克隆与设计能力。

@Gorden_Sun: 有道开源Confucius4-TTS 1.3B大小的TTS模型，支持多语言，支持语音克隆，效果不错，速度特别快。 Github：https://github.com/netease-youdao/Confucius4-TTS… 在线使用：…

X AI KOLs Timeline

有道开源了1.3B参数的Confucius4-TTS模型，支持14种语言的零样本语音克隆与跨语言语音合成，速度快且效果优秀。

@LinearUncle: 推荐一家叫模思的中国公司的开源声音克隆仓库： MOSS-TTS 你朗读一段文字，它克隆你的声音，然后就可以用你的声音朗读任意文本，查看帖子详情看我实战如何使用，效果很好，可以以假乱真。 https://github.com/OpenMOS…

X AI KOLs Timeline

MOSS-TTS是模思公司推出的开源声音克隆模型，用户朗读少量文本即可克隆声音，随后可用克隆的声音生成任意语音，效果逼真。

@Gorden_Sun: ZONOS2：开源MoE TTS模型 8B总参数，0.9B激活参数。支持多语言，支持语音克隆，支持中文，中文效果不错。模型：

X AI KOLs Timeline

Zyphra released ZONOS2, an open-source MoE text-to-speech model trained on over 6 million hours of multilingual speech, supporting voice cloning and high-quality synthesis across many languages.

相似文章

@Honcia13: 开源TTS直接卷疯了！园区诈骗又有新武器？ 清华 OpenBMB 刚刚放出 VoxCPM2： 200亿参数 + 200万小时多语言数据训练，48kHz录音棚级音质！ 最狠的是——完全不用Tokenizer，直接在连续潜空间做扩散自回归，细…

@Gorden_Sun: 有道开源Confucius4-TTS 1.3B大小的TTS模型，支持多语言，支持语音克隆，效果不错，速度特别快。 Github：https://github.com/netease-youdao/Confucius4-TTS… 在线使用：…

@Gorden_Sun: ZONOS2：开源MoE TTS模型 8B总参数，0.9B激活参数。支持多语言，支持语音克隆，支持中文，中文效果不错。 模型：

提交意见反馈

@Honcia13: 开源TTS直接卷疯了！园区诈骗又有新武器？清华 OpenBMB 刚刚放出 VoxCPM2： 200亿参数 + 200万小时多语言数据训练，48kHz录音棚级音质！最狠的是——完全不用Tokenizer，直接在连续潜空间做扩散自回归，细…

@Gorden_Sun: ZONOS2：开源MoE TTS模型 8B总参数，0.9B激活参数。支持多语言，支持语音克隆，支持中文，中文效果不错。模型：