3d-spatial-reasoning

#3d-spatial-reasoning

Skill-3D: Evolving Scene-Aware Skills for Agentic 3D Spatial Reasoning

Hugging Face Daily Papers ↗ · 2026-06-05 Cached

Skill-3D is a framework that enables AI agents to learn scene-aware skills through self-evolving memory and skill libraries, significantly improving tool utilization in 3D spatial reasoning tasks (e.g., from 39% to 78% on VSI-Bench).

0 favorites 0 likes

#3d-spatial-reasoning

Beyond 3D VQAs: Injecting 3D Spatial Priors into Vision-Language Models for Enhanced Geometric Reasoning

Hugging Face Daily Papers ↗ · 2026-05-28 Cached

This paper proposes GASP, a framework that injects geometric priors into vision-language models via deep supervision with contrastive and depth consistency losses, achieving significant improvements on 3D spatial reasoning benchmarks without using 3D VQA data.

0 favorites 0 likes

3d-spatial-reasoning

Skill-3D: Evolving Scene-Aware Skills for Agentic 3D Spatial Reasoning

Beyond 3D VQAs: Injecting 3D Spatial Priors into Vision-Language Models for Enhanced Geometric Reasoning

Submit Feedback