@_philschmid:使用新的 Gemini Live Translate、Next.js、LiveKit 和 Cloud Run 构建实时翻译应用。内容包括:1.…

X AI KOLs Following 产品

摘要

一篇关于使用 Gemini Live Translate、Next.js、LiveKit 和 Cloud Run 构建实时翻译应用的教程,涵盖音频流传输、翻译和部署。

使用新的 Gemini Live Translate、Next.js、LiveKit 和 Cloud Run 构建实时翻译应用。内容包括: 1. 通过 WebRTC 将主持人的音频流传输到 LiveKit 房间 2. 将 PCM 帧管道传输到 Gemini Live 进行实时翻译 3. 将翻译后的音频作为单独的语言音轨发布 4. 通过 100ms 帧分块优化延迟 (50Hz → 10Hz) 5. 使用 Secret Manager 和自动扩缩容部署到 Cloud Run 链接如下
查看原文
查看缓存全文

缓存时间: 2026/06/18 18:10

使用全新的 Gemini Live Translate、Next.js、LiveKit 和 Cloud Run 构建一个实时翻译应用。内容涵盖:

  1. 通过 WebRTC 将主持人音频流传输到 LiveKit Room
  2. 将 PCM 帧传输到 Gemini Live 进行即时翻译
  3. 将翻译后的音频作为独立的语言轨道发布
  4. 使用 100ms 帧分块优化延迟(50Hz → 10Hz)
  5. 使用 Secret Manager 和自动扩缩部署到 Cloud Run

相关链接

博客:https://dev.to/googleai/build-a-realtime-translation-app-with-gemini-live-api-livekit-google-cloud-run-5474…

代码:https://github.com/google-gemini/gemini-live-api-examples/tree/main/gemini-live-translate-livekit…

相似文章

Gemini 3.5 Live Translate

Product Hunt

Gemini 3.5 Live Translate 是一款全新的音频模型,用于实时语音到语音翻译。

借助 Gemini 3.5 Live Translate 实现流畅自然的语音翻译

Google DeepMind Blog

Google 发布了 Gemini 3.5 Live Translate,这是一款音频模型,支持超过 70 种语言的近乎实时的语音到语音翻译,并保留说话者的语调和节奏。该功能正在 Google 产品中逐步推出,包括 Gemini Live API、Google Meet 和 Google Translate。