标签
Gemini 3.5 Live Translate 提供近乎实时的语音翻译,作者认为若集成到可穿戴设备中,将打破语音语言障碍。
Google发布Gemini 3.5 Live Translate,这是一种语音到语音模型,可在70多种语言中提供即时语音翻译,并正在Google生态系统中推广。
OpenAI 发布了一个新的专用模型 gpt-realtime-translate,该模型可接收来自 70 多种输入语言的语音音频,并输出 13 种目标语言的语音,实现实时翻译。
Saydi 是一款实时语音翻译工具,让用户能够即时以首选语言听到对话内容。