vocabulary-gap

标签

Cards List
#vocabulary-gap

为什么先进编码器在稀疏检索上落后?答案及弥合词汇差距的方法

arXiv cs.AI · 2天前 缓存

本文指出词汇差距是导致ModernBERT等先进编码器在学习型稀疏检索中表现不佳的根本原因,并提出词汇迁移(VT)这一模型无关框架,将编码器迁移至稀疏友好的词汇表,在BEIR基准测试上取得最优结果。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈