我们给Reachy Mini装上了实时语音大脑
摘要
我们使用GPT Realtime给Reachy Mini机器人装上了实时语音大脑,使其能够通过麦克风听、摄像头看、扬声器说话,并通过动作工具做出物理反应。该项目已在GitHub上开源。
前几天我们参加了一个活动,发现这个小家伙躺在我们的桌子上,是一个来自Hugging Face的Reachy Mini。它是活动组织者女儿的。我们好奇它是怎么工作的,一小时后我们就给它装上了大脑。这个模型基本上变成了Reachy。它通过麦克风听,通过摄像头看,通过扬声器说话,并在说话时调用动作工具做出物理反应。仓库:[https://github.com/opper-ai/reachy-voice-realtime](https://github.com/opper-ai/reachy-voice-realtime) 关键点:* Web UI 可以实时查看摄像头画面、对话记录和工具调用。* 模型在对话中可调用19个动作与感知工具(表情、头部/触角/身体运动、摄像头、声音方向)。* 模仿你,挥手它就挥手,点头它就点头,歪头它就歪头。* 运行在GPT Realtime 2上,通过Opper路由,因此模型只需一行代码即可切换。* 实时客户端和工具层是分离的,因此你也可以直接连接到提供商或本地/开源实时模型。设置方法见README(Python 3.12+),MIT许可。我们把它还给了他的女儿,现在她终于可以和她的机器人对话了。
相似文章
@andimarafioti: Reachy Mini刚刚获得了新大脑!我们发布了一个完全开源的与Reachy Mini对话的后端。在过去48小时…
Reachy Mini拥有一个全新的完全开源后端,用于实时语音交互,本地运行音频模型,并利用LLM订阅来避免按秒计费的API成本。
推出 gpt-realtime 和实时 API 更新
# 推出 gpt-realtime 和实时 API 更新,用于生产级语音智能体 来源:[https://openai.com/index/introducing-gpt-realtime/](https://openai.com/index/introducing-gpt-realtime/) 今天我们推出了正式版实时 API,包含新功能,使开发者和企业能够构建可靠的、生产级就绪的语音智能体。该 API 现已支持远程 MCP 服务器、图像输入和通过会话初始协议 (SIP) 进行电话呼叫,使语音智能体更
@ruihan_mit:这个周末在物理人工智能黑客马拉松上,我们搭建了一个小巧的“熊猫大师”。一个经过 @huggingface 改造的 @ReachyMini 能够说话……
在物理人工智能黑客马拉松上,一个团队使用经过改造的 ReachyMini 机器人构建了“熊猫大师”,该机器人通过 GPT 进行对话,同时一个 Agilex Robotics 机械臂实时绘制“运势”卡片。
@KimNoel399: 今天是 Reachy mini 的生日。它是人机交互领域的杰出产品。观看它如何传达情感。一切……
该帖子庆祝了开源机器人 Reachy mini 的周年纪念日,该机器人专为机器人与人的互动和情感表达而设计,并与苹果的 HomePod 进行了有利的比较。
@waqasraza: Reachy Mini 已组装就绪,感谢 @huggingface 和 @pollenrobotics #reachymini #Ai
Reachy Mini 是一款由人工智能驱动的机器人,现已组装完毕并准备就绪,并向 Hugging Face 和 Pollen Robotics 表示感谢。