@taiyo_ai_gakuse: 哥们,我真的做了个超棒的东西哈哈,我自己构建了一个CLI,集成了新发布的GPT-Realtime-2,……
摘要
一位开发者分享了一个自定义CLI工具,利用新发布的GPT-Realtime-2 API,在视频会议平台中实现日英实时语音翻译。
哥们,我真的做了个超棒的东西哈哈,我自己构建了一个CLI,集成了新发布的GPT-Realtime-2,通过调整麦克风设置,在Google Meet或Zoom中,我的声音会被实时从日语翻译成英语。稍后开会时我会给你们展示演示,但这真的超疯狂哈哈
相似文章
构建实时语音翻译应用(阅读时长:28 分钟)
OpenAI 发布了 gpt-realtime-translate,这是一款专为实时口译优化的低延迟语音转语音模型,并附有开发者实战指南,用于构建支持多语言的浏览器、移动及视频应用。
@gdb: GPT-Realtime-2 用于即时实时翻译音频
GPT-Realtime-2 被介绍为一种用于即时实时音频翻译的工具。
@sama:人们真的开始使用语音与AI交互,尤其是当他们需要倾泻大量上下文时。GPT-Re…
Sam Altman 宣布将 GPT-Realtime-2 发布到 API,强调这是在语音与AI交互方面处理复杂上下文的一项重大进步。
推出 gpt-realtime 和实时 API 更新
# 推出 gpt-realtime 和实时 API 更新,用于生产级语音智能体 来源:[https://openai.com/index/introducing-gpt-realtime/](https://openai.com/index/introducing-gpt-realtime/) 今天我们推出了正式版实时 API,包含新功能,使开发者和企业能够构建可靠的、生产级就绪的语音智能体。该 API 现已支持远程 MCP 服务器、图像输入和通过会话初始协议 (SIP) 进行电话呼叫,使语音智能体更
实时 API 介绍
OpenAI 推出实时 API,使开发者能够构建低延迟多模态语音对话体验,由 GPT-4o 驱动的自然语音交互。该 API 支持六种预设声音,简化开发流程,无需集成多个模型。