标签
介绍了RobotValues,一个包含1万个价值观冲突场景的基准测试,用于评估家用机器人规划器。结果表明,视觉语言模型表现出默认的价值观偏好,并且在被要求优先考虑冲突的价值观时,有80%的情况无法覆盖其默认行为。