bm25

标签

Cards List
#bm25

无需训练的词汇-密集融合用于会话记忆检索

arXiv cs.LG · 4天前 缓存

本文提出了一种无需训练、仅使用CPU的检索方法,该方法将BM25词汇分数与后期交互密集分数相融合,用于会话记忆检索,在六个编码器上相比仅使用后期交互,在LoCoMo Hit@1上提升了高达+17.2个点。该研究提供了关于池化操作符、重排序器效果和基准鲁棒性的受控消融实验,将这种提升视为密集信号与词汇信号之间的分工。

0 人收藏 0 人点赞
#bm25

BM25 + 向量搜索 + RRF 真的值得吗?

Reddit r/AI_Agents · 4天前

本文质疑将 BM25 与向量搜索结合 RRF 是否能提高智能体记忆检索的命中率,并暗示仅使用 BM25 可能就足够了。

0 人收藏 0 人点赞
#bm25

@mixedbreadai:到如今,所有人都知道单向量嵌入模型对现代工作流极为有限。但它们包含更多…

X AI KOLs Following · 5天前 缓存

单向量嵌入模型可用于提取稀疏潜在术语,而BM25可将这一词汇转化为强大的检索器。

0 人收藏 0 人点赞
#bm25

花了太长时间调试RAG,后来才意识到分块一直是问题所在

Reddit r/ArtificialInteligence · 6天前

一位开发者回顾调试RAG系统的经历,发现固定大小分块会破坏句子边界,向量搜索无法处理精确标识符(用BM25解决),以及过时索引导致自信的错误答案。

0 人收藏 0 人点赞
#bm25

@bclavie: 非常兴奋终于能分享这个,已经藏着太久了!现在它非常应景。博客文章很快就会…

X AI KOLs Timeline · 2026-05-30 缓存

研究人员使用经过重构训练的稀疏自编码器,从冻结的密集检索器中提取出可索引且适用于BM25的稀疏特征。

0 人收藏 0 人点赞
#bm25

@_reachsumit: Latent Terms: 密集检索器包含可轻松提取的BM25就绪齐普夫词汇表 @bclavie 等人提取中…

X AI KOLs Following · 2026-05-29 缓存

该论文提出 Latent Terms 方法,使用稀疏自编码器从冻结的密集检索器中提取BM25就绪的稀疏特征,无需检索特定训练即可实现有竞争力的性能。

0 人收藏 0 人点赞
#bm25

@jerryjliu0:真正的问题是:文件搜索和检索的最新实际技术水平是什么?- 在文件系统上实际使用 grep…

X AI KOLs Following · 2026-05-18 缓存

Jerry Liu 询问文件搜索和检索的当前最先进技术,列出了从 grep 到数据库上的混合搜索等选项。

0 人收藏 0 人点赞
#bm25

@rwayne: Context Mode 解决了 AI Agent 的另一半上下文问题:工具输出沙箱化 + 会话持久化。 56 KB 的 Playwright 快照压缩到 299 字节,98% 的数据不进上下文。每次文件编辑、Git 操作、任务决策都存入…

X AI KOLs Timeline · 2026-05-12 缓存

Context Mode is a tool that solves AI agent context problems by sandboxing tool outputs and persisting sessions, achieving up to 98% compression of Playwright snapshots and using BM25 retrieval to reduce context window usage. It supports 15 platforms including Claude Code, Gemini CLI, VS Code Copilot, and is used by major tech companies.

0 人收藏 0 人点赞
#bm25

重新思考基于 Pi-Serini 的智能体搜索:词法检索是否足够?

Hugging Face Daily Papers · 2026-05-11 缓存

本文介绍了 Pi-Serini,这是一个基于 BM25 的智能体搜索系统。该系统证明了当智能体优化查询时,词法检索足以支持深度搜索,相比默认设置,它在实现高准确率的同时降低了成本。

0 人收藏 0 人点赞
#bm25

@DailyDoseOfDS_: 别再到处用向量搜索了!一个30年前的算法,无需训练、无需嵌入、无需微调……

X AI KOLs Timeline · 2026-05-07

文章反对过度使用向量搜索,强调BM25在精确关键词匹配上的有效性及其在混合搜索系统中的作用。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈