标签
本文介绍了一个后训练框架,利用SAM3D的3D先验来改进2D基础特征中的语义对应,解决了左右混淆和重复部分等问题。该方法使用实例特定的3D重建,无需姿态注释或球面几何捷径。
SpatialBench是一个综合基准,用于评估跨不同领域和任务的空间基础模型,揭示了当前模型的局限性,并引入了DA-Next-5M和DA-Next以推动空间表示学习。
A Zhejiang University researcher shared a comprehensive PhD guide on GitHub, covering the entire research lifecycle from topic selection to rebuttals, specifically tailored for the 3D Vision direction.
Meta AI 和牛津大学 VGG 发布了 VGGT-Omega,这是一个用于 3D 视觉的基础模型,附有项目页面和 GitHub 仓库。