view-planning

标签

Cards List
#view-planning

@ManlingLi_: 视图规划:VLM能否预测每个摄像机移动如何改变视图,并提前规划多个这样的移动?我们引入…

X AI KOLs Following · 昨天 缓存

介绍了ViewSuite,这是一个具有6自由度相机控制和约16.5万个任务的基准测试,用于评估VLM规划相机移动的能力。发现了一个规划差距:模型可以跟踪但无法组合计划,并提出了视图图蒸馏(RL-Graph-SFT)方法,将成功率从2.5%提升到47.8%。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈