vlm-agents

标签

Cards List
#vlm-agents

GROW: 将GRPO与状态-动作建模对齐用于开放世界VLM智能体

arXiv cs.LG · 2026-05-21 缓存

GROW提出了一种新颖的强化学习框架,通过将轨迹分解为状态-动作对并计算它们之间的优势,将GRPO适配到多轮VLM智能体任务中,在超过800个Minecraft任务上实现了最先进的性能。

0 人收藏 0 人点赞
#vlm-agents

AtlasVA:面向无教师VLM Agent的自进化视觉技能记忆

Hugging Face Daily Papers · 2026-05-18 缓存

AtlasVA是一个面向视觉语言模型Agent的无教师视觉技能记忆框架,它利用空间热图、视觉示例和符号文本技能来改善长时域任务中的空间决策,在多个基准测试中优于基线方法。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈