@GoogleDeepMind: 3.5 Live Translate 可以将语音转换为超过70种语言,并在流式传输时进行处理——同时保留语调、节奏…
摘要
Google DeepMind 宣布推出 Live Translate 功能,该功能可实时将语音转换为超过70种语言,同时保留语调、节奏和音高,以实现更自然的对话。
3.5 Live Translate 可以将语音转换为超过70种语言,并在流式传输时进行处理——同时完整保留语调、节奏和音高——从而实现更自然的对话。 https://t.co/EzbtyXkry1
查看缓存全文
缓存时间: 2026/06/10 00:17
3.5 Live Translate 可以将语音转换为超过70种语言,并在流式传输时进行处理——同时保持语调、语速和音高不变——从而实现更自然的对话。https://t.co/EzbtyXkry1
相似文章
Google发布Gemini 3.5 Live Translate,实现即时语音到语音翻译
Google发布Gemini 3.5 Live Translate,这是一种语音到语音模型,可在70多种语言中提供即时语音翻译,并正在Google生态系统中推广。
借助 Gemini 3.5 Live Translate 实现流畅自然的语音翻译
Google 发布了 Gemini 3.5 Live Translate,这是一款音频模型,支持超过 70 种语言的近乎实时的语音到语音翻译,并保留说话者的语调和节奏。该功能正在 Google 产品中逐步推出,包括 Gemini Live API、Google Meet 和 Google Translate。
@gdb: OpenAI 实时翻译 — 支持 70 多种输入语言,并翻译成 13 种输出语言:
OpenAI 发布了一个新的专用模型 gpt-realtime-translate,该模型可接收来自 70 多种输入语言的语音音频,并输出 13 种目标语言的语音,实现实时翻译。
@GoogleDeepMind:更自然的语音,支持70+种语言(如印地语、日语、德语),所有输出均带SynthID水印
Google DeepMind 升级语音合成模型,在70多种语言中声音更自然,并为所有输出添加 SynthID 水印。
Gemini 3.5 Live Translate
Gemini 3.5 Live Translate 是一款全新的音频模型,用于实时语音到语音翻译。