Gemini 3.5 Live Translate

Product Hunt 模型

摘要

Gemini 3.5 Live Translate 是一款全新的音频模型,用于实时语音到语音翻译。

<p> 最新的实时语音到语音翻译音频模型 </p> <p> <a href="https://www.producthunt.com/products/gemini-3-5-live-translate?utm_campaign=producthunt-atom-posts-feed&amp;utm_medium=rss-feed&amp;utm_source=producthunt-atom-posts-feed">讨论</a> | <a href="https://www.producthunt.com/r/p/1167824?app_id=339">链接</a> </p>
查看原文

相似文章

借助 Gemini 3.5 Live Translate 实现流畅自然的语音翻译

Google DeepMind Blog

Google 发布了 Gemini 3.5 Live Translate,这是一款音频模型,支持超过 70 种语言的近乎实时的语音到语音翻译,并保留说话者的语调和节奏。该功能正在 Google 产品中逐步推出,包括 Gemini Live API、Google Meet 和 Google Translate。

Gemini 3.1 Flash TTS

Simon Willison's Blog

Google 发布了 Gemini 3.1 Flash TTS,这是一个新的文本转语音模型,可通过 Gemini API 访问,支持基于提示的高级控制,以实现详细的语音方向、口音和说话风格。该模型能够生成复杂的音频,包括多说话人对话和特定角色的语音表演。