@antoine_chaffin: 虽然只是BEIR,但v2与LateOn之间相差近10分。我们也有充分证据表明该模型的泛化能力……
摘要
LateOn作为新一代ColBERT模型,在BEIR上相比v2提升了近10个百分点,并且在BEIR之外也表现出良好的泛化能力,同时在PyLate中的使用方法完全相同。
查看缓存全文
缓存时间: 2026/05/31 02:53
这仅仅是BEIR测试,但v2和LateOn之间差了将近10个点。
我们也有充分证据表明该模型在BEIR之外泛化得很好。
GTE-ModernColBERT是一次升级。
LateOn是全新一代。
而且它们都在PyLate中的用法完全相同。https://t.co/qfxH43r9Iv
Omar Khattab (@lateinteraction):
每月2000万下载量对colbertv2来说是一个新纪录。但人们或许应该从这款2021年10月的远古模型迁移到来自@raphaelsrty @antoine_chaffin等人(@LightOnIO)的LateOn colbert模型。
相似文章
@raphaelsrty:今天我们开源 LateOn 与 DenseOn,两款 149 M 参数的开放检索模型
Raphael 开源两款检索模型:LateOn(ColBERT 多向量)与 DenseOn(单向量),均 149 M 参数,在 BEIR 上超越体量 4 倍的大模型。
@antoine_chaffin: Reason-ModernColBERT 几乎完美解决了 BrowseComp-Plus,碾压 SOTA,并超越了 54 倍大的模型。还不错吧…
Reason-ModernColBERT 在 BrowseComp-Plus 上取得了近乎完美的结果,超越了 SOTA 和 54 倍大的模型,随后 Agent-ModernColBERT 通过极少的训练进一步提升了性能。
@AmelieTabatta: ColBERT 模型继续让体积为其 54 倍的模型颜面扫地,这就是我们信任 Late Interaction @LightOnIO 的原因。一条 1 年…
本文强调了 ColBERT 模型如何凭借延迟交互(late interaction)技术和极少微调,尽管体积更小且发布时间更早,仍优于 Qwen3-embed-8B 等更大规模的模型。
@raphaelsrty: 我们的LateOn模型以1.4亿参数取得了强劲结果。与LateOn无关,我对正…
拥有1.4亿参数的LateOn模型取得了强劲结果,社区对多向量模型的进展感到兴奋,包括新的CPU索引和多语言支持。
@LightOnIO:Reason-ModernColBERT 仅凭 149M 参数便在 BrowseComp-Plus 中拔得头筹。如今,Agent-ModernColBERT 在此基础上又提升了约 10%。达到…
LightOn 发布了 Agent-ModernColBERT,这是一个拥有 1.49 亿参数的开源检索模型。通过将在查询中整合智能体推理轨迹,其性能可与 GPT-5 搭配 Qwen3-Embed-8B 相媲美。