标签
OpenAI推出了三个新的实时音频模型,支持连续、多任务的语音交互,优先考虑长上下文推理、实时翻译和无缝工具使用。
# 推出 gpt-realtime 和实时 API 更新,用于生产级语音智能体 来源:[https://openai.com/index/introducing-gpt-realtime/](https://openai.com/index/introducing-gpt-realtime/) 今天我们推出了正式版实时 API,包含新功能,使开发者和企业能够构建可靠的、生产级就绪的语音智能体。该 API 现已支持远程 MCP 服务器、图像输入和通过会话初始协议 (SIP) 进行电话呼叫,使语音智能体更
# Genspark 推出由 GPT-4.1 和 OpenAI Realtime API 驱动的无代码个人智能体 来源: [https://openai.com/index/genspark/](https://openai.com/index/genspark/) [Genspark\(opens in a new window\)](https://www.genspark.ai/) 是 Super Agent 的开发公司,这是一款无代码、可定制的 AI 智能体,帮助用户自动化现实任务,例如拨打电话、生成演示文稿或将食谱转换成短视频。Super Agent 使用 OpenAI 多模态模型和 Realtime API 来启用任务
OpenAI 推出实时 API,使开发者能够构建低延迟多模态语音对话体验,由 GPT-4o 驱动的自然语音交互。该 API 支持六种预设声音,简化开发流程,无需集成多个模型。