标签
Ego2World将第一人称烹饪视频(HD-EPIC)转换为具有图转换规则的可执行符号世界,从而能够在部分观察下评估信念状态规划。实验表明,信念记忆提高了任务完成率,表明它应该成为具身智能体评估的首要目标。
提出VeGAS框架,一种针对基于MLLM的具身智能体的测试时框架,该框架采样多个候选动作,并利用生成式验证器选择最可靠的动作,在挑战性任务上相比CoT基线实现了高达36%的相对性能提升。
本文介绍了“持续增强框架”(Continual Harness),该框架使具身人工智能智能体能够在无需重置环境的情况下实现在线自我改进。研究展示了在《宝可梦》游戏中的显著进展,通过自动化提示词和技能优化,智能体达到了人类水平的表现。