标签
介绍了ViewSuite,这是一个具有6自由度相机控制和约16.5万个任务的基准测试,用于评估VLM规划相机移动的能力。发现了一个规划差距:模型可以跟踪但无法组合计划,并提出了视图图蒸馏(RL-Graph-SFT)方法,将成功率从2.5%提升到47.8%。