Show HN: Semble – 面向代理的代码搜索,令牌使用量比 grep 减少 98%
摘要
Semble 是一款面向 AI 代理的快速代码搜索库,令牌使用量比 grep+read 减少约 98%,在 CPU 上运行,无外部依赖,并通过 MCP 或 CLI 集成。
嘿,HN!我们(Stephan 和 Thomas)最近开源了 Semble。我们在使用 Claude Code 处理大型代码库时,一直遇到同样的问题:当代理无法直接找到某些内容时,它会退而使用 grep,读取整个文件或启动子代理。这会消耗大量令牌,并且常常仍会遗漏相关代码。现有的一些工具要么按需索引速度过慢,要么需要 API 密钥,要么检索质量不佳。<p>Semble 是我们对此的解决方案。它将静态 Model2Vec 嵌入(使用我们最新的静态模型:potion-code-16M)与 BM25 结合,通过 RRF 融合,并利用代码感知信号进行重排序。由于不涉及 Transformer,所有操作均在 CPU 上运行。在我们包含约 1250 个查询/文档对(涵盖 63 个仓库和 19 种语言)的基准测试中,它比 grep+read 减少 98% 的令牌使用量,达到 1.37 亿参数代码训练 Transformer 的 99% 检索质量,同时速度快约 200 倍。<p>主要特性:<p>- 令牌高效:比 grep+read 减少 98% 的令牌使用<p>- 快速:在我们的基准测试中,索引典型仓库约需 250 毫秒,CPU 上每次查询约 1.5 毫秒(非常大的仓库可能需要更长时间)<p>- 准确:NDCG@10 达到 0.854,是我们测试过的最佳 Transformer 配置的 99%<p>- MCP 服务器:可直接用于 Claude Code、Cursor、Codex、OpenCode<p>- 零配置:无需 API 密钥、无需 GPU、无需外部服务<p>在 Claude Code 中安装:
claude mcp add semble -s user -- uvx --from "semble[mcp]" semble<p>或查看我们的 README 了解其他安装说明、基准测试和方法:<p>Semble:<a href="https://github.com/MinishLab/semble" rel="nofollow">https://github.com/MinishLab/semble</a><p>基准测试:<a href="https://github.com/MinishLab/semble/tree/main/benchmarks" rel="nofollow">https://github.com/MinishLab/semble/tree/main/benchmarks</a><p>模型:<a href="https://huggingface.co/minishlab/potion-code-16M" rel="nofollow">https://huggingface.co/minishlab/potion-code-16M</a><p>如有任何反馈或疑问,请随时告知我们!
查看缓存全文
缓存时间: 2026/05/17 21:50
快速准确的代码搜索代理,使用的令牌比grep+read少约98%
相似文章
@omarsar0: // Is Grep All You Need? // 注意了,AI开发者们。(收藏起来)他们发现,grep风格的文本搜索,当…
PwC的一篇研究论文发现,当正确集成到代理框架中时,grep风格的文本搜索在编码代理任务上可以匹配或超越基于嵌入的检索,这表明向量数据库对许多用例可能并非必需。
Show HN: 轻量级多AI代理对话方案,无需API付费
一种轻量级模式,用于编排多个AI代理(Claude、Codex、Gemini)之间的对话,通过CLI实现,无需API付费,利用会话恢复来维持跨代理交互的上下文。
@HowToAI_: 现在只需一条命令,您就能将 Claude Code 的工具调用次数削减94%。这个 MCP 服务器将您的代码库索引到…
一个新的 MCP 服务器通过将代码库索引到本地知识图谱中,将 Claude Code 的工具调用减少94%,使代理能够查询图谱而不是扫描文件。
@RoundtableSpace: SocratiCode 为您的 AI 提供对整个代码库的深度语义理解 - 依赖图、符号级影响分析…
SocratiCode 是一个零配置工具,为 AI 提供对代码库的深度语义理解,减少上下文和工具调用,同时完全本地且免费。
Show HN:面向AI代理的Git
re_gent 是一个开源的版本控制系统,专为AI代理活动设计,记录每一次工具调用及其相关提示,使开发者能够审查和回滚代理的变更。