全实时交互模型

Reddit r/LocalLLaMA 模型

摘要

讨论一个即将通过API发布的完全实时交互模型,并计划从中生成蒸馏数据。

我知道这个模型不会开源权重,发布时也将通过API提供,但我发帖只是想告诉大家,就在它发布的那个瞬间,你我都知道——我和其他许多人会从API中生成海量的蒸馏数据。因为至少对我而言,一个能够完全自主行动的想法本身就令人着迷。我引用的是这篇文章:[https://thinkingmachines.ai/blog/interaction-models/](https://thinkingmachines.ai/blog/interaction-models/)
查看原文

相似文章

交互模型

Hacker News Top

Thinking Machines AI 宣布推出交互模型的研究预览版,这是一种专为音频、视频和文本领域原生、实时人机协作而设计的全新架构。通过以多流、微轮次设计取代传统的轮流交互界面,该模型旨在让人类始终保持在环,同时提供业界领先的智能水平与响应速度。

实时 API 介绍

OpenAI Blog

OpenAI 推出实时 API,使开发者能够构建低延迟多模态语音对话体验,由 GPT-4o 驱动的自然语音交互。该 API 支持六种预设声音,简化开发流程,无需集成多个模型。