标签
SleepWalk 是一个三层基准,用于评估视觉语言模型从文本指令和视觉观察中预测3D环境中空间连贯轨迹的能力,揭示了在遮挡和多步指令下接地空间推理的系统性失败。
DeepMind推出SIMA 2,这是一款与Gemini集成的升级版AI智能体,能够在虚拟3D世界中进行推理、对话和自我改进,标志着向AGI和具身智能迈出了重要一步。