active-visual-reasoning

标签

Cards List
#active-visual-reasoning

Visual-Seeker: 通过主动视觉推理实现视觉原生多模态代理搜索

arXiv cs.AI · 2026-06-16 缓存

Visual-Seeker 提出了一种视觉原生多模态深度搜索代理,它主动推理细粒度视觉细节并综合多模态证据,在五个具有挑战性的多模态搜索基准上实现了最先进的性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈