@DrJimFan:今天,我们为机器人赋予了一个能够自我进化并无限累积的 /技能库!隆重介绍 ASPIRE:一个在解决第100个任务时不再像解决第一个任务那样茫然的机器人。
摘要
介绍 ASPIRE,一个让机器人通过进化搜索和蒸馏不断进化技能库的框架,实现高效的 sim-to-real 和跨本体迁移,迁移学习 token 减少高达 10 倍。完整代码已开源。
查看缓存全文
缓存时间: 2026/06/30 21:48
今天,我们为机器人提供了一个 /skills library,它能自我进化并无限累积!介绍ASPIRE:一个机器人解决第100个任务时不再像解决第一个任务时那样不知所措。编码智能体观察模拟环境和真实机器人的多模态感知轨迹,对控制程序进行进化搜索,并将最佳技能提炼到一个不断扩展的库中。
ASPIRE是一种新型的持续学习:“训练“是技能精炼而非梯度下降。 “训练好的模型“是一个感觉运动技能仓库,而非浮点权重。 “分布式训练”是一组智能体各自练习不同技能,而非分片小批量。
美在何处:ASPIRE为那些老生常谈的术语“sim2real transfer“和“cross-embodiment transfer“赋予了全新的含义。弥合模拟到现实的鸿沟是出了名的困难。一个端到端策略必须同时处理视觉差异(模拟环境在真实摄像头旁显得像玩具)以及它从未完全掌握的微妙接触物理学。ASPIRE绕开了这些麻烦,因为它不传输像素或权重跨越鸿沟,而是传输技能知识。机器人仍然需要在现实世界中练习,不是零样本,但它的速度要快得多,因为它不必从头重新发现策略。同样,从单臂到双臂硬件的迁移通常需要新数据并从零重新训练。ASPIRE实现了“迁移学习“ token 最高约10倍的削减(没错,token 是训练计算的新单位;)
在我们的网站上查看机器人自学的150+任务和90+技能的图库!有点疯狂的是,我们可以将“学习到的权重“以HTML页面而非GGUF格式交付。我们将开源整个技术栈,这样你自己的机器人库就可以从我们的开始累积增长!
深入探讨线程:
项目图库和白皮书:https://research.nvidia.com/labs/gear/aspire/…
ASPIRE是NVIDIA GEAR实验室、密歇根大学、伯克利和卡内基梅隆大学之间的一次伟大合作。感谢所有全心投入这个项目的合著者!
查看来自Guanzhi的深入探讨线程:
相似文章
ASPIRE:面向机器人的自主技能发现
ASPIRE 是一个持续学习系统,通过迭代探索自主开发和优化机器人控制程序,在操作任务和家务任务中取得显著提升,并实现了从仿真到现实的迁移。
NVIDIA ASPIRE 使机器人能够从成功经验中积累知识,并将其复用于新任务,创建一个随学习不断改进的持久技能库
NVIDIA 的 ASPIRE 框架使机器人能够从成功经验中构建一个持久的技能库,允许复用于新任务,并随着时间的推移提高学习效率。
SkillFlow:自主智能体终身技能发现与演化基准测试
SkillFlow 推出了一个涵盖20个任务家族共166项任务的基准测试,用于评估自主智能体在终身学习协议下,随时间推移发现、修复并维护技能的能力。实验揭示了主流模型之间存在显著的能力差距:Claude Opus 4.6 通过技能演化获得了显著提升,而其他模型的收益有限甚至为负。
@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2069064122218717387
本文探讨了AI代理如何利用微软研究院的SkillOpt等技术自动编写和优化其技能文件,该技术将技能文档视为可训练状态,并带来显著的性能提升。文章还解决了手动技能调优的挑战,并介绍了GEPA和EvoSkill等进化方法的框架。
@DrJimFan: 我保证这会是你今天花的最好的20分钟!机器人学:终局,是我去年Sequoia AI Asce…的续集
在Sequoia AI Ascent演讲中,Jim Fan博士提出了与LLM成功相平行的实现Physical AGI路线图,介绍了视频世界模型、World Action Models (WAM) 和 Dexterity Scaling Law 等概念,并分享了对近期未来的预测。