我给我的OpenClaw智能体赋予了实体身躯

Wired 新闻

摘要

作者为其OpenClaw AI智能体配备了一个实体机械臂,成功配置使其能够抓取物体并训练另一个AI模型,展示了AI可以简化机器人控制。

AI模型的编程能力即将让机器人的构建和部署变得更容易。
查看原文
查看缓存全文

缓存时间: 2026/05/20 21:46

# 我给了我的OpenClaw智能体一副物理身体 来源:https://www.wired.com/story/i-gave-my-openclaw-agent-physical-body-robot/ 我最近给了我的OpenClaw(https://www.wired.com/story/malevolent-ai-agent-openclaw-clawdbot/)一个真实的机械臂来玩。结果几乎让我的神经网络炸裂。 这个AI智能体能够配置机械臂,用它来看并慢慢抓取物体,甚至训练另一个AI模型来拾取和放置特定物体。而他们还说通用人工智能还要几年才能实现!(我开玩笑的,可能确实如此)。 这些结果让我相信,我们可能正处于机器人技术突破的边缘。过去训练和控制机器人需要相当的技巧。而今天的人工智能模型几乎让这件事变得简单。 “由人工智能驱动的编程非常令人兴奋,因为它有潜力弥合传统工程方法与现代视觉-语言-动作模型之间的差距。传统方法可靠但不具备泛化能力,现代模型能泛化但还不够可靠。”加州大学伯克利分校的机器人学家肯·戈德伯格说道,他正在探索这种方法。 我让OpenClaw试着移动它的新机械臂,它做出了这样一个小小的挥手动作。 我让OpenClaw试着移动它的新机械臂,它做出了这样一个小小的挥手动作。 我买了一个预装机械臂,名为LeRobot 101(https://huggingface.co/docs/lerobot/so101)。它是HuggingFace的一个开源项目的一部分,使得开始构建和实验机器人变得相对便宜。 LeRobot配有两个机械臂:一个控制臂,人通过手柄和扳机操作;一个跟随臂,带有摄像头,能复制控制臂的动作。你可以通过远程操作控制臂来训练AI模型,让模型学习如何根据摄像头看到的内容来移动跟随臂。 ## 使用OpenClaw进行构建 在使用OpenClaw之前,我花了几个小时尝试连接和校准机器人,有一段时间因为应用了错误的设置几乎烧毁电机,导致它们过热。 然后,在OpenClaw和Codex的帮助下,我能够凭感觉编写一个简单程序,当它发现一个红球时,就关闭夹爪的夹持器。在终端中,Codex完成了配置机器人连接的棘手工作。然后,在我的帮助下,它校准了关节的位置。它还写了一个Python脚本,使用了多个库来识别并抓取那个球。当然,“感觉编程”并不完美,幻觉可能会引入错误,尤其是在处理不同硬件时,但结果令人印象深刻。 然后,在我的帮助下,机器人智能体学会了如何识别并抓取一个红球。 然后,在我的帮助下,机器人智能体学会了如何识别并抓取一个红球。 虽然结果很不错,但还远不是《终结者》。接下来,我尝试让OpenClaw帮我训练一个模型来控制机械臂。我们尝试了几种不同的方法,OpenClaw擅长引导我完成整个过程,并在每次训练后检查模型的错误率。 最终,机械臂能够拾取物体了。 最终,机械臂能够拾取物体了。 ## 代码即策略 AI驱动的编程可能为制造机器人提供强大新方法的想法,最早在2022年的一篇研究论文(https://arxiv.org/abs/2209.07753)中被强调,该论文将这种方法称为“代码即策略”。此后,AI的编程技能以令人眼花缭乱的速度进步,“代码即策略”方法在许多实验室中得到了应用。 Goldberg的研究团队与Nvidia、卡内基梅隆大学和斯坦福大学的研究人员合作,最近开发了一个名为CaP-X(https://capgym.github.io/)的新基准,用于衡量编码模型的机器人能力。有趣的是,CaP-X显示,编程机器人的最佳模型不是Claude或ChatGPT,而是Gemini——可能是因为Google DeepMind专注于训练其模型实现多模态(https://www.wired.com/story/google-io-astra-multimodal-answer-chatgpt/),并理解物理世界。除了基准测试外,研究人员还创建了CaP-Gym,这是一个让编码智能体控制模拟和真实机器人的环境。他们还开发了CaP-Agent0,一个智能体框架,极大地提升了编码模型的性能,使其在某些操作任务上击败了直接训练来控制机器人运动的模型。 Goldberg的团队正在与Nvidia合作,探索“代码即策略”方法的潜力。我与Spencer Huang(不是别人,正是黄仁勋的儿子)进行了交谈,他参与了公司内部组织黑客马拉松的活动,让人们尝试凭感觉编程机器人。Huang目前正与Goldberg合作一个研究项目,该项目应该使“代码即策略”方法与更多的机器人软件工具兼容。 “几乎任何人都可以进入机器人领域,这才是真正的圣杯,”Huang告诉我。让人们能够通过口头或键入命令,或通过演示动作来控制机器人,是“机器人在社会中应用的关键解锁,”他补充道。

相似文章

Nemotron Labs:OpenClaw Agent 对各类组织的意义

NVIDIA Blog

OpenClaw 是一个开源的持久化 AI 助手,已成为 GitHub 上星标最多的项目,引发了关于安全与自主性的讨论。NVIDIA 正与其合作以增强安全性,并发布了 NemoClaw 作为安全的参考实现。