@antoine_chaffin: Reason-ModernColBERT 几乎完美解决了 BrowseComp-Plus,碾压 SOTA,并超越了 54 倍大的模型。还不错吧…
摘要
Reason-ModernColBERT 在 BrowseComp-Plus 上取得了近乎完美的结果,超越了 SOTA 和 54 倍大的模型,随后 Agent-ModernColBERT 通过极少的训练进一步提升了性能。
查看缓存全文
缓存时间: 2026/05/12 14:52
Reason-ModernColBERT 几乎完美攻克了 BrowseComp-Plus,以绝对优势刷新 SOTA,甚至超越了比它大 54 倍的模型。
对于一个没有为深度研究优化、仅诞生一年的模型来说,这表现不俗。
如果我们真的认真试试呢?
隆重介绍 Agent-ModernColBERT:只需 5 分钟训练,性能再提升 10% https://t.co/yLeItKXwba
相似文章
@LightOnIO:Reason-ModernColBERT 仅凭 149M 参数便在 BrowseComp-Plus 中拔得头筹。如今,Agent-ModernColBERT 在此基础上又提升了约 10%。达到…
LightOn 发布了 Agent-ModernColBERT,这是一个拥有 1.49 亿参数的开源检索模型。通过将在查询中整合智能体推理轨迹,其性能可与 GPT-5 搭配 Qwen3-Embed-8B 相媲美。
@AmelieTabatta: ColBERT 模型继续让体积为其 54 倍的模型颜面扫地,这就是我们信任 Late Interaction @LightOnIO 的原因。一条 1 年…
本文强调了 ColBERT 模型如何凭借延迟交互(late interaction)技术和极少微调,尽管体积更小且发布时间更早,仍优于 Qwen3-embed-8B 等更大规模的模型。
@antoine_chaffin: 虽然只是BEIR,但v2与LateOn之间相差近10分。我们也有充分证据表明该模型的泛化能力……
LateOn作为新一代ColBERT模型,在BEIR上相比v2提升了近10个百分点,并且在BEIR之外也表现出良好的泛化能力,同时在PyLate中的使用方法完全相同。
@bo_wangbo:我们在内部随意训练了很多SOTA搜索模型,要不要时不时搞个小发布?
暗示即将以低调方式发布一个强大的开源多语言ColBERT搜索模型。
@bo_wangbo: 好吧,也许这是个好时机?我们在pplx训练了一个小型colbert模型,它是对pplx-embed-0.6的继续训练…
Perplexity AI发布了pplx-embed-v1-late-0.6b,一个用于检索的小型ColBERT后期交互嵌入模型,基于他们现有的嵌入模型微调并针对MaxSim评分进行了优化,现已在HuggingFace上开源。