@GoogleDeepMind：团队无需编写复杂代码，仅用日常英语即可与Spot交互。我们搭建了Gemini Ro…

X AI KOLs 2026/04/16 13:03 产品

robotics gemini natural-language multimodal ai-integration

摘要

Google DeepMind已将Gemini与波士顿动力的Spot机器人整合，实现无需复杂编码的自然语言控制。用户现在可以用日常英语指令Spot执行导航、拍照、物体操控等复杂任务。

团队无需编写复杂代码，仅用日常英语与Spot交互。我们在Gemini Robotics ER与Spot系统之间搭建了一座桥梁，赋予AI一套基本工具，使其能够自由移动、拍照和抓取物品——从而能够执行更复杂的任务。

查看原文

查看缓存全文

缓存时间: 2026/04/20 09:39

团队无需编写复杂代码，仅通过日常英语即可与Spot进行交互。我们在Gemini Robotics ER与Spot系统之间搭建了一座桥梁，为AI配备了一套基础工具——使其能够自由移动、拍照及抓取物品——从而支持其执行更复杂的任务。

相似文章

@GoogleDeepMind: 我们与@BostonDynamics合作，将Gemini Robotics具身推理模型应用于他们的Spot机器人。这意味着…

X AI KOLs

Google DeepMind与Boston Dynamics合作，将Gemini Robotics具身推理模型集成到Spot机器人中，使其能够更好地理解环境、识别物体并执行整理房间等任务的指令。

Gemini Robotics 将 AI 引入物理世界

Google DeepMind Blog

Google DeepMind 推出 Gemini Robotics，这是一个基于 Gemini 2.0 的视觉-语言-动作模型，可以控制物理机器人，具有更强的通用性、交互性和灵巧性。该公司还推出了用于空间推理的 Gemini Robotics-ER，并与 Apptronik 合作开发人形机器人。

Gemini Robotics 1.5 将 AI 智能体带入物理世界

Google DeepMind Blog

Google DeepMind 推出 Gemini Robotics 1.5 和 Gemini Robotics-ER 1.5，推进了物理 AI 智能体的发展，这些智能体能够感知、规划、思考和行动来完成复杂的多步骤任务。Gemini Robotics-ER 1.5 现已通过 Gemini API 向开发者提供。

@GoogleDeepMind: 我们正在利用 AI 重新构想一个拥有 50 年历史的人机交互界面——鼠标指针。这些实验性演示展示了人们如…

X AI KOLs

Google DeepMind 正在尝试利用 Gemini AI 重新构想鼠标指针界面，让用户能够通过手势动作、语音输入以及自然简写来控制屏幕。

@GoogleDeepMind：Deep Research 与 Deep Research Max 是我们最新的自主研究智能体，由 Gemini 3.1 Pro 驱动，可安全……

X AI KOLs

Google DeepMind 推出 Deep Research 与 Deep Research Max，两款基于 Gemini 3.1 Pro 的自主智能体，可浏览网络及自定义数据，生成带完整引用的专业报告。

提交意见反馈