ASPIRE:面向机器人的自主技能发现

Hugging Face Daily Papers 论文

摘要

ASPIRE 是一个持续学习系统,通过迭代探索自主开发和优化机器人控制程序,在操作任务和家务任务中取得显著提升,并实现了从仿真到现实的迁移。

传统机器人编程充满挑战:需要协调多模态感知、管理物理接触动力学、处理多样化配置和执行失败。我们提出 ASPIRE(Agentic Skill Programming through Iterative Robot Exploration,即通过迭代探索的自主技能编程),这是一个持续学习系统,能够在“代码即策略”范式下自主编写和优化机器人控制程序,同时将经验积累为可复用的技能库。ASPIRE 发现的技能可跨任务、跨仿真与现实环境以及跨机器人形态持续生效。该系统以开放式循环运行,包含三个组件:(1)闭环机器人执行引擎,提供细粒度多模态追踪,支持自主故障诊断、修复合成与验证;(2)持续扩展的技能库,将验证的修复方案提炼为可复用、可迁移的知识;(3)进化搜索机制,生成多样化任务序列和控制程序,以超越单轨迹优化的局限。在 LIBERO-Pro 扰动操作任务中,ASPIRE 相较此前方法提升高达 77%;在 Robosuite 双臂移交任务中提升 72%;在 BEHAVIOR-1K 长时家务任务中提升 32%。其累积的技能库还能实现零样本泛化至未见过的长时任务:在 LIBERO-Pro Long 任务中,ASPIRE 成功率达 31%,而此前方法即使利用测试时推理和重试也仅为 4%。此外,仿真中发现的技能初步展示了从仿真到现实迁移的能力,显著减少了不同机器人形态和 API 下的真实机器人编程工作量。
查看原文
查看缓存全文

缓存时间: 2026/07/02 07:47

论文页面 - ASPIRE:面向机器人的自主技能发现与编程

来源:https://huggingface.co/papers/2607.00272
作者:

摘要

ASPIRE 是一个持续学习系统,能够通过迭代探索自主开发并优化机器人控制程序。该系统在操作任务和家务任务中实现了卓越的性能与零样本泛化能力,同时支持从仿真到现实的迁移。

传统机器人编程充满挑战:需要协调多模态感知、管理物理接触动力学、处理多样化的配置与执行失败。我们提出了 ASPIRE(Agentic Skill Programming through Iterative Robot Exploration,通过迭代探索的自主技能编程),这是一个持续学习系统,能够在“代码即策略”范式下自主编写并优化机器人控制程序,同时将积累的经验提炼为可复用的技能库。ASPIRE 发现的技能可跨任务、跨仿真与真实环境、跨机器人形态迁移。系统以开放式循环运行,包含三个组成部分:(1) 一个闭环机器人执行引擎,提供细粒度的多模态轨迹,支持自主故障诊断、修复合成与验证;(2) 一个持续扩展的技能库,将验证通过的修复方案蒸馏为可复用、可迁移的知识;(3) 进化搜索机制,生成多样化的任务序列与控制程序,从而探索超出单条轨迹优化的范围。ASPIRE 在多个基准测试中显著超越现有方法:在 LIBERO-Pro 扰动操作任务上领先最高 77%,在 Robosuite 双臂交接任务上领先 72%,在 BEHAVIOR-1K 长时域家务任务上领先 32%。其累积的技能库还实现了对未见长时域任务的零样本泛化:在 LIBERO-Pro Long 任务上,ASPIRE 取得了 31% 的成功率,而现有方法即便使用了测试时推理与重试,成功率仅为 4%。最后,仿真中发现的技能初步展示了从仿真到现实的迁移能力,大幅减少了不同机器人形态与 API 下的真实机器人编程工作量。

查看 arXiv 页面 (https://arxiv.org/abs/2607.00272)
查看 PDF (https://arxiv.org/pdf/2607.00272)
项目页面 (https://research.nvidia.com/labs/gear/aspire/)
添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2607.00272)

在你的智能体中获取这篇论文:

hf papers read 2607\.00272

没有最新命令行工具?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用该论文的模型0

暂无模型关联此论文

在模型 README.md 中引用 arxiv.org/abs/2607.00272 即可从此页面链接。

引用该论文的数据集0

暂无数据集关联此论文

在数据集 README.md 中引用 arxiv.org/abs/2607.00272 即可从此页面链接。

引用该论文的 Space0

暂无 Space 关联此论文

在 Space README.md 中引用 arxiv.org/abs/2607.00272 即可从此页面链接。

包含该论文的收藏0

暂无收藏包含此论文

添加此论文到收藏 (https://huggingface.co/new-collection) 即可从此页面链接。

相似文章

ENPIRE: 现实世界中自主机器人策略自我改进

Hugging Face Daily Papers

ENPIRE是一个框架,通过环境反馈、策略优化和进化代码优化的闭环系统,使机器人能够在现实世界中自主实现策略自我改进,在灵巧操作任务上达到99%的成功率。

Asmi AI

Product Hunt

Asmi AI 是一款在现实世界中处理个人杂务的AI工具。

技能的递归自我改进 (Skill RSI)

Reddit r/AI_Agents

Skill RSI 是一个免费工具,通过程序化评估和研究代理,以递归方式评估和改进 AI 技能,支持独立使用或作为 Codex 插件使用。