@raphaelsrty:今天我们开源 LateOn 与 DenseOn,两款 149 M 参数的开放检索模型
摘要
Raphael 开源两款检索模型:LateOn(ColBERT 多向量)与 DenseOn(单向量),均 149 M 参数,在 BEIR 上超越体量 4 倍的大模型。
今天我们正式发布 LateOn 与 DenseOn,两款 149 M 参数的开放检索模型。
- LateOn(ColBERT,多向量):BEIR 上 NDCG@10 达 57.22
- DenseOn(稠密,单向量):BEIR 上 NDCG@10 达 56.20
两者均优于体量高达 4 倍的竞品。模型权重以 Apache 2.0 协议完全开源。
查看缓存全文
缓存时间: 2026/04/21 17:13
今天我们发布 LateOn 与 DenseOn。两款开源检索模型,参数量均为 1.49 亿。LateOn(ColBERT,多向量)在 BEIR 上达到 57.22 NDCG@10;DenseOn(稠密,单向量)为 56.20。两者均击败体量高达 4 倍的模型。我们以 Apache 2.0 协议开源权重。
相似文章
@antoine_chaffin:新一代开源SOTA单向量与多向量检索模型来了——DenseOn & LateOn上线
LightOn发布DenseOn与LateOn,新一代开源SOTA单向量与多向量检索模型,全面超越现有模型。
@raphaelsrty: 我们的LateOn模型以1.4亿参数取得了强劲结果。与LateOn无关,我对正…
拥有1.4亿参数的LateOn模型取得了强劲结果,社区对多向量模型的进展感到兴奋,包括新的CPU索引和多语言支持。
@antoine_chaffin: 虽然只是BEIR,但v2与LateOn之间相差近10分。我们也有充分证据表明该模型的泛化能力……
LateOn作为新一代ColBERT模型,在BEIR上相比v2提升了近10个百分点,并且在BEIR之外也表现出良好的泛化能力,同时在PyLate中的使用方法完全相同。
@liquidai: 介绍 LFM2.5-Embedding-350M 和 LFM2.5-ColBERT-350M:两款为超快且精准的多语言检索模型
Liquid AI 推出 LFM2.5-Embedding-350M 和 LFM2.5-ColBERT-350M,这两款多语言检索模型经过优化,可在11种语言中实现快速准确的搜索,延迟低至1.5毫秒。
LiquidAI/LFM2.5-ColBERT-350M
LiquidAI 发布 LFM2.5-ColBERT-350M,这是一种后期交互多语言检索模型,同时还有一个密集双编码器变体,两者均基于 LFM2.5-350M-Base,支持 11 种语言,并设计为 RAG 管道的即插即用替代品。