标签
小米发布 MiMo 系列模型更新,包括 mimo-v2.5-asr(支持多种方言和歌词转写)、mimo-v2.5-pro(万亿参数、1M上下文)、mimo-v2.5(全模态感知)、以及 TTS 系列模型,显著提升了 Agent 性能和复杂声学场景下的识别能力。
介绍了一个开源的语音合成模型,20亿参数、200万小时训练,支持30种语言和9种中国方言,可用自然语言描述音色,3秒录音即可克隆声音,音质达48kHz,Apache-2.0协议免费商用。