multi-speaker

标签

Cards List
#multi-speaker

Fish Audio S2 技术报告

Papers with Code Trending · 2026-03-09 缓存

Fish Audio S2 是一个开源的文本转语音系统,支持多说话人、多轮生成以及指令跟随控制,并由具备低延迟特性的生产级推理引擎提供支持。

0 人收藏 0 人点赞
#multi-speaker

VibeVoice 技术报告

Papers with Code Trending · 2025-08-26 缓存

VibeVoice 是微软推出的一款新模型,它利用 Next-Token Diffusion(下一令牌扩散)和一种高度高效的连续语音分词器,生成长形式多说话人语音。该模型实现了卓越的保真度和压缩率,支持长达 90 分钟的多说话人音频生成。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈