3d-environments

#3d-environments

看向何处：基础模型能否通过主动探索达到目标视角？

Hugging Face Daily Papers ↗ · 2026-05-31 缓存

介绍了 Target Viewpoint Reproduction (TVR) 任务和 TVRBench 基准，用于评估基础模型主动调整 3D 视角以匹配目标图像的能力。实验揭示了当前开源和闭源模型的显著局限性，统一的后训练框架将成功率从约12%提升至约51%。

0 人收藏 0 人点赞

#3d-environments

Hugging Face Daily Papers ↗ · 2026-05-11 缓存

SleepWalk 是一个三层基准，用于评估视觉语言模型从文本指令和视觉观察中预测3D环境中空间连贯轨迹的能力，揭示了在遮挡和多步指令下接地空间推理的系统性失败。

0 人收藏 0 人点赞

#3d-environments

Google DeepMind Blog ↗ · 2025-11-13 缓存

DeepMind推出SIMA 2，这是一款与Gemini集成的升级版AI智能体，能够在虚拟3D世界中进行推理、对话和自我改进，标志着向AGI和具身智能迈出了重要一步。

0 人收藏 0 人点赞