sparse-retrieval

标签

Cards List
#sparse-retrieval

为什么先进编码器在稀疏检索上落后?答案及弥合词汇差距的方法

arXiv cs.AI · 2天前 缓存

本文指出词汇差距是导致ModernBERT等先进编码器在学习型稀疏检索中表现不佳的根本原因,并提出词汇迁移(VT)这一模型无关框架,将编码器迁移至稀疏友好的词汇表,在BEIR基准测试上取得最优结果。

0 人收藏 0 人点赞
#sparse-retrieval

@lateinteraction: Late-interaction稀疏检索?利用神经元级倒排索引,基于无监督稀疏自编码器。效果更佳…

X AI KOLs Timeline · 2026-05-30 缓存

本文提出了一种使用无监督稀疏自编码器和自然倒排索引的单阶段稀疏编码方法,以加速多向量检索,其效果优于传统的基于k-means的方法。

0 人收藏 0 人点赞
#sparse-retrieval

@_reachsumit: Latent Terms: 密集检索器包含可轻松提取的BM25就绪齐普夫词汇表 @bclavie 等人提取中…

X AI KOLs Following · 2026-05-29 缓存

该论文提出 Latent Terms 方法,使用稀疏自编码器从冻结的密集检索器中提取BM25就绪的稀疏特征,无需检索特定训练即可实现有竞争力的性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈