visual-textual

标签

Cards List
#visual-textual

Unveil: 多模态文档检索的统一视觉-文本融合与蒸馏

arXiv cs.CL · 2026-05-26 缓存

Unveil提出了一个用于多模态文档检索的统一视觉-文本嵌入框架,通过知识蒸馏将语义理解从视觉-文本模型转移到纯视觉模型,实现鲁棒且高效的检索。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈