multimodal-agents

标签

Cards List
#multimodal-agents

面向视觉原生多模态深度搜索智能体的同策略数据演化

Hugging Face Daily Papers · 2天前 缓存

本文介绍了同策略数据演化(ODE)和一种视觉原生智能体框架,以提升多模态深度搜索智能体的性能。通过实现视觉证据的可重用性和闭环数据生成,ODE 显著提升了 Qwen3-VL 智能体在多个基准测试中的表现,超越了 Gemini 2.5 Pro。

0 人收藏 0 人点赞
#multimodal-agents

HyperEyes:面向并行多模态搜索代理的双粒度效率感知强化学习

Hugging Face Daily Papers · 5天前 缓存

HyperEyes 是一种并行多模态搜索代理,它利用双粒度强化学习来优化推理效率,与现有代理相比,在显著减少工具调用轮次的同时实现了更高的准确率。

0 人收藏 0 人点赞
#multimodal-agents

InterLV-Search:交织多模态智能体搜索基准测试

Hugging Face Daily Papers · 5天前 缓存

InterLV-Search 是本文提出的一项新基准,旨在评估交织的语言-视觉智能体搜索能力,凸显了当前系统在视觉证据搜集和多模态融合方面的局限性。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈