3d-environments

标签

Cards List
#3d-environments

看向何处:基础模型能否通过主动探索达到目标视角?

Hugging Face Daily Papers · 2026-05-31 缓存

介绍了 Target Viewpoint Reproduction (TVR) 任务和 TVRBench 基准,用于评估基础模型主动调整 3D 视角以匹配目标图像的能力。实验揭示了当前开源和闭源模型的显著局限性,统一的后训练框架将成功率从约12%提升至约51%。

0 人收藏 0 人点赞
#3d-environments

SleepWalk:一个用于压力测试指令引导的视觉语言导航的三层基准

Hugging Face Daily Papers · 2026-05-11 缓存

SleepWalk 是一个三层基准,用于评估视觉语言模型从文本指令和视觉观察中预测3D环境中空间连贯轨迹的能力,揭示了在遮挡和多步指令下接地空间推理的系统性失败。

0 人收藏 0 人点赞
#3d-environments

SIMA 2:在虚拟3D世界中与你一起游玩、推理和学习的智能体

Google DeepMind Blog · 2025-11-13 缓存

DeepMind推出SIMA 2,这是一款与Gemini集成的升级版AI智能体,能够在虚拟3D世界中进行推理、对话和自我改进,标志着向AGI和具身智能迈出了重要一步。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈