Google发布Gemini 3.5 Live Translate，实现即时语音到语音翻译

Ars Technica 2026/06/09 18:57 模型

google gemini-3-5 live-translate voice-translation real-time multilingual ai-model

摘要

Google发布Gemini 3.5 Live Translate，这是一种语音到语音模型，可在70多种语言中提供即时语音翻译，并正在Google生态系统中推广。

多年来，Google一直在追求实时翻译，据称这始终是其“开创性的机器学习实验”之一。过去，我们在Google活动的舞台上见过无数演示，但你需要Google手机、耳机或其他特定设备。去年，Google在Translate应用中将实时翻译带给了更多用户，现在它正在进一步扩大可用性。随着Gemini 3.5 Live Translate的发布，你可以在更多地方以更低的延迟体验即时翻译。 这款新AI模型属于在<a href="https://arstechnica.com/google/2026/05/google-announces-agent-optimized-gemini-3-5-flash-and-a-do-anything-model-called-omni/">I/O大会上发布</a>的3.5系列。在此之前，Google仅推出了Flash版本，但我们预计未来几周内还会发布Pro模型。Gemini 3.5 Live Translate是一款语音到语音模型，经过调优后可自动检测并翻译70多种语言。 <a href="https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-live-3-5-translate/">Google表示</a>，Gemini 3.5 Live Translate的速度足以跟上正常对话节奏，仅比说话者慢几秒钟，同时还能匹配语调、语速和音高。简而言之，语音听起来更像你本人，而不是通用的机器人。所有演示均在受控条件下录制，听起来确实令人印象深刻。不过，你很快就能亲自验证该模型的能力。<a href="https://arstechnica.com/ai/2026/06/google-announces-gemini-3-5-live-translate-for-instant-voice-to-voice-translation/">阅读全文</a> <a href="https://arstechnica.com/ai/2026/06/google-announces-gemini-3-5-live-translate-for-instant-voice-to-voice-translation/#comments">评论</a>

查看原文

查看缓存全文

缓存时间: 2026/06/10 00:19

# Google 宣布 Gemini 3.5 Live Translate：即时语音到语音翻译来源：https://arstechnica.com/ai/2026/06/google-announces-gemini-3-5-live-translate-for-instant-voice-to-voice-translation/ 多年来，Google 一直在追求实时翻译，并将其称为“开创性的机器学习实验之一”。过去，我们在 Google 活动的舞台上见过无数演示，但都需要 Google 手机、耳机或其他特定设备。去年，Google 在 Translate 应用中为更多用户带来了实时翻译，如今正进一步扩大覆盖面。随着 Gemini 3.5 Live Translate 的发布，你将能在更多场景中、以更低的延迟获得即时翻译。这款新 AI 模型是 3.5 系列的一部分，该系列在 I/O 大会（https://arstechnica.com/google/2026/05/google-announces-agent-optimized-gemini-3-5-flash-and-a-do-anything-model-called-omni/）上推出。在此之前，Google 仅推出了 Flash 版本，但我们预计 Pro 模型将在未来几周内上线。Gemini 3.5 Live Translate 是一款语音到语音模型，经过调优可自动检测并翻译超过 70 种语言。 Google 表示（https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-live-3-5-translate/），Gemini 3.5 Live Translate 速度快到足以跟上正常对话，仅落后说话者几秒钟，同时还能匹配语调、语速和音高。简而言之，声音听起来更像你本人，而不是一个普通的机器人。在受控条件下录制的演示确实令人印象深刻。不过，你很快就能亲自验证该模型的能力。 Google Meet 中的 Gemini 3.5 Live Translate 语音翻译。 Gemini 3.5 Live Translate 正在 Google 生态系统的多个部分逐步推出。开发者可以通过 Gemini Live API 或 AI Studio 公开预览进行开发。该模型持续处理语音，并自动处理所有多语言输入，省去了开发者手动配置设置的工作。它还能在嘈杂环境中过滤掉背景噪音。

Google发布Gemini 3.5 Live Translate，实现即时语音到语音翻译

相似文章

借助 Gemini 3.5 Live Translate 实现流畅自然的语音翻译

Gemini 3.5 Live Translate

Gemini 音频模型升级，打造更强大的语音体验

Google准备为网页版推出Skills和Gemini Live（2分钟阅读）

Gemini 3.1 Flash Live：让音频 AI 更自然、更可靠

提交意见反馈