@GoogleDeepMind:团队无需编写复杂代码,仅用日常英语即可与Spot交互。我们搭建了Gemini Ro…
摘要
Google DeepMind已将Gemini与波士顿动力的Spot机器人整合,实现无需复杂编码的自然语言控制。用户现在可以用日常英语指令Spot执行导航、拍照、物体操控等复杂任务。
查看缓存全文
缓存时间: 2026/04/20 09:39
团队无需编写复杂代码,仅通过日常英语即可与Spot进行交互。我们在Gemini Robotics ER与Spot系统之间搭建了一座桥梁,为AI配备了一套基础工具——使其能够自由移动、拍照及抓取物品——从而支持其执行更复杂的任务。
相似文章
@GoogleDeepMind: 我们与@BostonDynamics合作,将Gemini Robotics具身推理模型应用于他们的Spot机器人。这意味着…
Google DeepMind与Boston Dynamics合作,将Gemini Robotics具身推理模型集成到Spot机器人中,使其能够更好地理解环境、识别物体并执行整理房间等任务的指令。
Gemini Robotics 将 AI 引入物理世界
Google DeepMind 推出 Gemini Robotics,这是一个基于 Gemini 2.0 的视觉-语言-动作模型,可以控制物理机器人,具有更强的通用性、交互性和灵巧性。该公司还推出了用于空间推理的 Gemini Robotics-ER,并与 Apptronik 合作开发人形机器人。
Gemini Robotics 1.5 将 AI 智能体带入物理世界
Google DeepMind 推出 Gemini Robotics 1.5 和 Gemini Robotics-ER 1.5,推进了物理 AI 智能体的发展,这些智能体能够感知、规划、思考和行动来完成复杂的多步骤任务。Gemini Robotics-ER 1.5 现已通过 Gemini API 向开发者提供。
@GoogleDeepMind: 我们正在利用 AI 重新构想一个拥有 50 年历史的人机交互界面——鼠标指针。这些实验性演示展示了人们如…
Google DeepMind 正在尝试利用 Gemini AI 重新构想鼠标指针界面,让用户能够通过手势动作、语音输入以及自然简写来控制屏幕。
@GoogleDeepMind:Deep Research 与 Deep Research Max 是我们最新的自主研究智能体,由 Gemini 3.1 Pro 驱动,可安全……
Google DeepMind 推出 Deep Research 与 Deep Research Max,两款基于 Gemini 3.1 Pro 的自主智能体,可浏览网络及自定义数据,生成带完整引用的专业报告。