AI编程代理可自主指导机器人训练
摘要
使用开源ENPIRE框架的AI编码代理能够自主训练机器人执行如安装GPU和切割扎带等任务,系统可在一夜之间自我改进。
<p>当你给AI编码代理一个装满机械臂的实验室、一些计算资源以及用于教授机器人各种任务的“慷慨的代币预算”时,会发生什么?这些代理显然能制定出一套训练方案,教会机器人成功切割扎带,甚至将GPU插入主板上的狭窄插槽。</p>
<p>这一瞥AI如何以完全自主的方式实现机器人训练自动化的景象,得益于一个新的代理框架软件——它包裹着AI模型,使其能够使用各种工具,同时提供记忆、上下文、约束和反馈循环等能力。这个被称为ENPIRE的智能代理框架,由NVIDIA GEAR(通用具身智能体研究)实验室的机器人研究人员与匹兹堡的卡内基梅隆大学以及加州大学伯克利分校的合作者共同开发。</p>
<p>“我们NVIDIA GEAR实验室的一部分现在能在一夜之间不知疲倦地自我改进,”NVIDIA AI总监Jim Fan在<a href="https://www.linkedin.com/feed/update/urn:li:activity:7472689415681699840/">LinkedIn帖子</a>中写道。“我们早上只需阅读报告即可。”</p><p><a href="https://arstechnica.com/ai/2026/06/ai-coding-agents-can-autonomously-direct-robot-training/">阅读全文</a></p>
<p><a href="https://arstechnica.com/ai/2026/06/ai-coding-agents-can-autonomously-direct-robot-training/#comments">评论</a></p>
查看缓存全文
缓存时间: 2026/06/17 20:41
# AI编码代理教会机器人安装GPU和剪扎带
来源:https://arstechnica.com/ai/2026/06/ai-coding-agents-can-autonomously-direct-robot-training/
当你给AI编码代理一个装满机械臂的实验室、一些计算资源,以及一个用于教机器人各种任务的“慷慨的令牌预算”时,会发生什么?这些代理似乎能够自主找出训练方案,教会机器人成功剪断扎带,甚至将GPU插入主板上狭小的插槽中。
这一关于AI如何以完全自主方式实现机器人训练自动化的洞察,得益于一种新的代理框架——这是一种包裹在AI模型周围的软件,使其能够使用各种工具,同时提供记忆、上下文、约束和反馈循环等功能。这个名为ENPIRE的代理框架由英伟达GEAR(通用具身代理研究)实验室的机器人学研究人员与卡内基梅隆大学(匹兹堡)和加州大学伯克利分校的合作者共同开发。
“我们NVIDIA GEAR实验室的一部分现在可以彻夜不休地自我改进,”英伟达AI总监Jim Fan在LinkedIn帖子中写道。“我们只需早上阅读报告。”
Fan还开玩笑地描述了这种AI主导机器人训练的目标,称:“我们都去度假,Jensen甚至不会注意到。”这里指的是英伟达创始人兼CEO黄仁勋。但受益的不仅仅是英伟达的机器人研究人员——Fan表示团队将开源所有内容,以便任何人都可以在家中搭建自己的“自运行机器人实验室”。
ENPIRE框架包含四个模块,使AI编码代理能够:对任务进行自动重置和验证;优化指导机器人行为的策略;并行评估多个物理机器人的策略;以及通过分析日志、阅读研究论文、改进训练基础设施和算法代码来处理故障。更多技术细节可在2026年6月16日上传的研究论文中找到。
该框架在三个不同的AI编码代理上进行了测试,包括OpenAI的Codex(基于GPT-5.5)、Anthropic的Claude Code(基于Opus 4.7)和月之暗面的Kimi Code(基于Kimi K2.6)。这些编码代理团队分别开发了不同的机器人训练算法方法,在真实世界实验中进行了测试,然后保留了那些在反复的自主测试循环中提高整体成功率的更改。
相似文章
与代理协作编程
与代理协作编程探讨了AI代理如何帮助开发者编写代码、自动化任务以及提高生产力。
@DrJimFan:今天,我们首次在物理世界中启用自动研究!介绍ENPIRE:我们给8个Codex智能体一个机器人舰队……
NVIDIA GEAR实验室推出了ENPIRE,这是一个使用8个Codex智能体自主控制机器人舰队执行物理任务(如扎扎带、安装GPU)的系统,展示了自我改进的机器人研究以及一种新的'physical scaling'现象。
学习的机器人
# 学习的机器人 来源:[https://openai.com/index/robots-that-learn/](https://openai.com/index/robots-that-learn/) 该系统由两个神经网络驱动:视觉网络和模仿网络。视觉网络接收来自机器人摄像头的图像,并输出表示物体位置的状态。如[前所述\(在新窗口中打开\)](https://blog.openai.com/spam-detection-in-the-physical-world/),视觉网络使用数十万个模拟
@tom_doerr: 零配置多代理AI编码设置 https://github.com/lee-to/ai-factory…
AI Factory 是一个零配置的开发者工具,它搭建了一个多代理AI编码环境,内置技能、规范驱动开发,并支持多种AI代理(如 Claude、Cursor 和 Codex),让用户只需一条命令即可开始构建。
AI 编码代理需要“先计划后编辑”的工作流程?征求反馈
一种为 AI 编码代理提出的工作流程,强调在代码编辑之前进行头脑风暴和执行边界约束,寻求社区对其实用性的反馈。