@gdb: OpenAI 实时翻译 — 支持 70 多种输入语言,并翻译成 13 种输出语言:

X AI KOLs Following 模型

摘要

OpenAI 发布了一个新的专用模型 gpt-realtime-translate,该模型可接收来自 70 多种输入语言的语音音频,并输出 13 种目标语言的语音,实现实时翻译。

OpenAI 实时翻译 — 支持 70 多种输入语言,并翻译成 13 种输出语言:
查看原文
查看缓存全文

缓存时间: 2026/05/29 21:55

OpenAI 推出实时翻译功能——支持 70 多种输入语言,并可翻译成 13 种输出语言:

cayden 凯登 (@caydengineer): OpenAI 刚刚发布了一款全新类型的模型

gpt-realtime-translate 可接收任意语言的语音音频,并输出你目标语言的语音

大型语言模型固然强大,但特定场景仍需专用模型

我们正将其应用于智能眼镜

相似文章

@seclink: OpenAI 发布了 GPT-Realtime-2,这是其迄今为止最智能的语音模型。 该模型具备 GPT-5 级别的推理能力、128,000 个 token 的上下文窗口,并支持调节“投入程度”以实现更自然的对话体验。 它可与 GPT-R…

X AI KOLs Following

OpenAI发布了GPT-Realtime-2语音模型,具备GPT-5级别的推理能力和128,000 token上下文窗口,支持实时翻译70多种语言到13种输出语言,在Big Bench Audio Intelligence评测中达到96.6%准确率,Greg Brockman称其为语音翻译领域的里程碑。

We’re introducing three audio models in the API

YouTube AI Channels

OpenAI 在 API 中推出了三个实时音频模型,包括支持70种语言的实时翻译模型 GPT Realtime Translate 和具备推理能力的语音智能体 GPT Realtime 2,使开发者能够构建更自然的语音交互界面。

API 推出全新模型,推动语音智能发展

OpenAI Blog

OpenAI 在 API 中发布了三款全新语音模型:具备高级推理能力的 GPT-Realtime-2、支持实时多语言翻译的 GPT-Realtime-Translate,以及用于流式转录的 GPT-Realtime-Whisper,旨在实现更自然、更具行动力的语音应用。