embodied-navigation

#embodied-navigation

Image2Sim: 通过生成式神经模拟器实现具身导航规模化

Hugging Face Daily Papers ↗ · 2026-07-07 缓存

Image2Sim是一个神经模拟框架，它能从RGB-D图像创建高保真交互环境，为具身导航智能体提供可扩展的训练。该框架生成了近20K场景和超过1000万训练样本，在基准测试上展现了显著改进，并实现了有效的真实世界零样本迁移。

0 人收藏 0 人点赞

#embodied-navigation

Hugging Face Daily Papers ↗ · 2026-06-01 缓存

PlatonicNav 提出了一种免训练的具体化导航框架，该框架仅使用视觉语义地图和盲匹配来锚定语言目标，无需显式的跨模态训练即可实现跨任务和跨形态的泛化。

0 人收藏 0 人点赞

#embodied-navigation

Hugging Face Daily Papers ↗ · 2026-05-18 缓存

AtlasVA是一个面向视觉语言模型Agent的无教师视觉技能记忆框架，它利用空间热图、视觉示例和符号文本技能来改善长时域任务中的空间决策，在多个基准测试中优于基线方法。

0 人收藏 0 人点赞