标签
Mixedbread宣布,用户现在可以自带云存储桶,从而通过延迟交互模型实现零保留索引和搜索。
TopK 推出了 semantic_index,这是一种单一的 schema 注解,抽象了生产系统中多向量检索的复杂性,实现了亚秒级延迟和高吞吐量的最先进性能。
PyLate的发布引入了MaxSim内核,用于GPU加速训练,内存需求更低;以及TACHIOM,用于在CPU上实现快速多向量索引和搜索。
Argus-Retriever 是一种新型的延迟交互视觉文档检索器,它根据查询自适应文档表示,在 ViDoRe 基准测试上以更小的索引实现了 SOTA 性能。
一份精选的顶级模型、引擎、库和数据集的列表,用于晚期交互多向量检索,组织在'Awesome Multivector Retrieval'资源中。
LateOn作为新一代ColBERT模型,在BEIR上相比v2提升了近10个百分点,并且在BEIR之外也表现出良好的泛化能力,同时在PyLate中的使用方法完全相同。
作者分享了他们通过将k-means用作top-1稀疏编码来降低多向量检索成本的工作。Omar Khattab补充说,在无监督稀疏自编码器上使用神经元级别倒排索引的晚期交互稀疏检索效果很好。
本文提出了一种使用无监督稀疏自编码器和自然倒排索引的单阶段稀疏编码方法,以加速多向量检索,其效果优于传统的基于k-means的方法。
ProtoCol将后期交互检索应用于蛋白质同源搜索,将蛋白质表示为残基嵌入集,并使用MaxSim进行评分,在远程同源基准上优于池化方法和基于比对的方法。
SMART是一个框架,能够解锁单向量模型中的潜在多向量能力,用于多模态检索,通过对比训练和后期交互推理,在降低计算成本的同时提升最先进的性能。
在 Hugging Face 上发布了一个内核,通过使用分块评分和 SIMD 组矩阵运算(Metal 和 WMMA)来加速 MaxSim 后期交互检索,比朴素实现获得了 3–5 倍的加速。
LightOn 使用一个 1.5 亿参数的后期交互模型,达到了 GPT-5 级别的深度研究检索性能,这是一项了不起的成就。
本文强调了 ColBERT 模型如何凭借延迟交互(late interaction)技术和极少微调,尽管体积更小且发布时间更早,仍优于 Qwen3-embed-8B 等更大规模的模型。
LightOn 发布了 Agent-ModernColBERT,这是一个拥有 1.49 亿参数的开源检索模型。通过将在查询中整合智能体推理轨迹,其性能可与 GPT-5 搭配 Qwen3-Embed-8B 相媲美。
新论文表明,后期交互检索模型的表示可替代原始文档文本,在RAG任务中拓展其应用边界。
一场主题演讲认为,后期交互检索(如 ColBERT 风格)是 AI 规模信息检索研究中最具前景的方向,并指出单向量密集检索存在根本性缺陷,呼吁信息检索社区大幅提升研究雄心。演讲引入 LIMIT 基准测试,作为密集检索泛化能力不足的佐证,并呼吁在 2030 年前实现范式转变。