@_albertgu: 为@cartesia团队推出Sonic 3.5感到无比自豪,它树立了TTS领域的新标杆。我个人…

X AI KOLs Following 模型

摘要

Cartesia推出Sonic 3.5,这是一款支持42种语言的全新TTS模型,在Artificial Analysis Speech Arena排行榜上位居榜首。

为@cartesia团队推出Sonic 3.5感到无比自豪,它树立了TTS领域的新标杆。 我本人主导了该模型的技术方向;我们从基本原理出发,完全自主构建了这一模型,其中包含多项与现有文献中任何内容都大不相同的非传统创新思路。看到研究假设得以验证,以及Cartesia强大的研究团队不断壮大,这让我深感欣慰。
查看原文
查看缓存全文

缓存时间: 2026/05/22 23:54

非常自豪 @cartesia 团队发布了 Sonic 3.5,它树立了 TTS 领域的新标杆

我本人领导了该模型的技术方向;我们从基本原理出发,完全自主构建,其中包含多个与现有文献截然不同的重要创新点。看到研究假设得到验证,以及 Cartesia 强大的研究团队持续壮大,这让我倍感欣慰!

Artificial Analysis (@ArtificialAnlys): Cartesia 的 Sonic-3.5 在 Artificial Analysis 语音竞技场排行榜上夺得第一,超越了 Inworld Realtime TTS 1.5 Max 和 Google 的 Gemini 3.1 Flash TTS

Sonic-3.5 是 @cartesia 的最新 TTS 模型。它支持 42 种语言,涵盖 9 种印度语言,其

相似文章

@kwindla: https://x.com/kwindla/status/2062544580105359686

X AI KOLs Timeline

NVIDIA 发布了 Nemotron 3.5 ASR,这是一款开源的多语言语音转文字模型,在测试中延迟最低,提供多语言和纯英文两个版本,非常适合语音助手和自托管部署场景。