visual-textual

标签

#visual-textual

Unveil: 多模态文档检索的统一视觉-文本融合与蒸馏

arXiv cs.CL ↗ · 2026-05-26 缓存

Unveil提出了一个用于多模态文档检索的统一视觉-文本嵌入框架，通过知识蒸馏将语义理解从视觉-文本模型转移到纯视觉模型，实现鲁棒且高效的检索。

0 人收藏 0 人点赞

← 返回首页

提交意见反馈