@DrJimFan:今天,我们为机器人赋予了一个能够自我进化并无限累积的 /技能库!隆重介绍 ASPIRE:一个在解决第100个任务时不再像解决第一个任务那样茫然的机器人。

X AI KOLs Timeline 论文

摘要

介绍 ASPIRE,一个让机器人通过进化搜索和蒸馏不断进化技能库的框架,实现高效的 sim-to-real 和跨本体迁移,迁移学习 token 减少高达 10 倍。完整代码已开源。

今天,我们为机器人赋予了一个能够自我进化并无限累积的 /技能库!隆重介绍 ASPIRE:一个在解决第100个任务时不再像解决第一个任务那样茫然的机器人。编码智能体观察来自仿真和真实机器人的多模态感官轨迹,对控制程序进行进化搜索,并将最佳经验蒸馏到一个不断扩展的库中。 ASPIRE 是一种新型的持续学习:"训练"是技能精炼而非梯度下降。 "训练好的模型"是感觉运动技能的仓库而非浮点权重。 "分布式训练"是一组智能体各自练习不同技能而非分片的小批量。 美妙之处在于:ASPIRE 赋予了“仿真到现实迁移”和“跨本体迁移”这两个老生常谈的术语全新的含义。弥合仿真与现实的差距极其困难。端到端策略必须同时应对视觉差异(仿真中的画面相比真实摄像头显得玩具化)和它从未完全掌握微妙的接触物理。ASPIRE 绕过了这些麻烦,因为它不跨越差距传输像素或权重,而是传输经验。机器人仍然要在真实世界中练习,而非零样本,但速度要快得多,因为它不需要从头重新发现策略。同样,从单臂到双臂硬件的迁移通常需要新数据并从零开始重新训练。ASPIRE 实现了迁移学习 token 减少约 10 倍(没错,token 是训练计算的新单位 ;)) 请在我们的网站上查看机器人自学完成的 150+ 个任务和 90+ 个技能库!有点疯狂的是,我们可以将“学习到的权重”以 HTML 页面而非 GGUF 的形式发布。我们将开源整个技术栈,这样你自己的机器人库就可以从我们的基础上开始累积! 深入探讨见下一条推文:
查看原文
查看缓存全文

缓存时间: 2026/06/30 21:48

今天,我们为机器人提供了一个 /skills library,它能自我进化并无限累积!介绍ASPIRE:一个机器人解决第100个任务时不再像解决第一个任务时那样不知所措。编码智能体观察模拟环境和真实机器人的多模态感知轨迹,对控制程序进行进化搜索,并将最佳技能提炼到一个不断扩展的库中。

ASPIRE是一种新型的持续学习:“训练“是技能精炼而非梯度下降。 “训练好的模型“是一个感觉运动技能仓库,而非浮点权重。 “分布式训练”是一组智能体各自练习不同技能,而非分片小批量。

美在何处:ASPIRE为那些老生常谈的术语“sim2real transfer“和“cross-embodiment transfer“赋予了全新的含义。弥合模拟到现实的鸿沟是出了名的困难。一个端到端策略必须同时处理视觉差异(模拟环境在真实摄像头旁显得像玩具)以及它从未完全掌握的微妙接触物理学。ASPIRE绕开了这些麻烦,因为它不传输像素或权重跨越鸿沟,而是传输技能知识。机器人仍然需要在现实世界中练习,不是零样本,但它的速度要快得多,因为它不必从头重新发现策略。同样,从单臂到双臂硬件的迁移通常需要新数据并从零重新训练。ASPIRE实现了“迁移学习“ token 最高约10倍的削减(没错,token 是训练计算的新单位;)

在我们的网站上查看机器人自学的150+任务和90+技能的图库!有点疯狂的是,我们可以将“学习到的权重“以HTML页面而非GGUF格式交付。我们将开源整个技术栈,这样你自己的机器人库就可以从我们的开始累积增长!

深入探讨线程:

项目图库和白皮书:https://research.nvidia.com/labs/gear/aspire/…

ASPIRE是NVIDIA GEAR实验室、密歇根大学、伯克利和卡内基梅隆大学之间的一次伟大合作。感谢所有全心投入这个项目的合著者!

查看来自Guanzhi的深入探讨线程:

相似文章

ASPIRE:面向机器人的自主技能发现

Hugging Face Daily Papers

ASPIRE 是一个持续学习系统,通过迭代探索自主开发和优化机器人控制程序,在操作任务和家务任务中取得显著提升,并实现了从仿真到现实的迁移。

SkillFlow:自主智能体终身技能发现与演化基准测试

Hugging Face Daily Papers

SkillFlow 推出了一个涵盖20个任务家族共166项任务的基准测试,用于评估自主智能体在终身学习协议下,随时间推移发现、修复并维护技能的能力。实验揭示了主流模型之间存在显著的能力差距:Claude Opus 4.6 通过技能演化获得了显著提升,而其他模型的收益有限甚至为负。

@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2069064122218717387

X AI KOLs Timeline

本文探讨了AI代理如何利用微软研究院的SkillOpt等技术自动编写和优化其技能文件,该技术将技能文档视为可训练状态,并带来显著的性能提升。文章还解决了手动技能调优的挑战,并介绍了GEPA和EvoSkill等进化方法的框架。