gpt-realtime

#gpt-realtime

@FarzaTV：看我用声音控制电脑。这是操作系统的未来。无需手动。GPT-Realtime 2.0 是…

X AI KOLs Following ↗ · 2026-05-30 缓存

一个演示展示了使用 GPT-Realtime 2.0 完全通过语音控制计算机，展示了无需手动操作的操作系统界面。

0 人收藏 0 人点赞

#gpt-realtime

Reddit r/LocalLLaMA ↗ · 2026-05-29

我们使用GPT Realtime给Reachy Mini机器人装上了实时语音大脑，使其能够通过麦克风听、摄像头看、扬声器说话，并通过动作工具做出物理反应。该项目已在GitHub上开源。

0 人收藏 0 人点赞

#gpt-realtime

X AI KOLs Following ↗ · 2026-05-07

OpenAI 发布了 gpt-realtime-2，一款新的语音到语音模型，针对实时语音代理交互和低延迟工具调用进行了优化。

0 人收藏 0 人点赞

#gpt-realtime

X AI KOLs Following ↗ · 2026-05-07

GPT-Realtime-2 在 Big Bench Audio 基准测试中较 1.5 版本提升了 15 个百分点，性能已接近饱和水平。

0 人收藏 0 人点赞

#gpt-realtime

X AI KOLs ↗ · 2026-05-07 缓存

Sam Altman 宣布将 GPT-Realtime-2 发布到 API，强调这是在语音与AI交互方面处理复杂上下文的一项重大进步。

0 人收藏 0 人点赞

#gpt-realtime

OpenAI Blog ↗ · 2026-05-07 缓存

OpenAI 在 API 中发布了三款全新语音模型：具备高级推理能力的 GPT-Realtime-2、支持实时多语言翻译的 GPT-Realtime-Translate，以及用于流式转录的 GPT-Realtime-Whisper，旨在实现更自然、更具行动力的语音应用。

0 人收藏 0 人点赞