Show HN: Semble – 面向代理的代码搜索，令牌使用量比 grep 减少 98%

Hacker News Top 2026/05/17 15:37 工具

code-search agents token-efficiency open-source mcp-server command-line-tool python

摘要

Semble 是一款面向 AI 代理的快速代码搜索库，令牌使用量比 grep+read 减少约 98%，在 CPU 上运行，无外部依赖，并通过 MCP 或 CLI 集成。

嘿，HN！我们（Stephan 和 Thomas）最近开源了 Semble。我们在使用 Claude Code 处理大型代码库时，一直遇到同样的问题：当代理无法直接找到某些内容时，它会退而使用 grep，读取整个文件或启动子代理。这会消耗大量令牌，并且常常仍会遗漏相关代码。现有的一些工具要么按需索引速度过慢，要么需要 API 密钥，要么检索质量不佳。Semble 是我们对此的解决方案。它将静态 Model2Vec 嵌入（使用我们最新的静态模型：potion-code-16M）与 BM25 结合，通过 RRF 融合，并利用代码感知信号进行重排序。由于不涉及 Transformer，所有操作均在 CPU 上运行。在我们包含约 1250 个查询/文档对（涵盖 63 个仓库和 19 种语言）的基准测试中，它比 grep+read 减少 98% 的令牌使用量，达到 1.37 亿参数代码训练 Transformer 的 99% 检索质量，同时速度快约 200 倍。主要特性：- 令牌高效：比 grep+read 减少 98% 的令牌使用- 快速：在我们的基准测试中，索引典型仓库约需 250 毫秒，CPU 上每次查询约 1.5 毫秒（非常大的仓库可能需要更长时间）- 准确：NDCG@10 达到 0.854，是我们测试过的最佳 Transformer 配置的 99%- MCP 服务器：可直接用于 Claude Code、Cursor、Codex、OpenCode- 零配置：无需 API 密钥、无需 GPU、无需外部服务在 Claude Code 中安装： claude mcp add semble -s user -- uvx --from "semble[mcp]" semble或查看我们的 README 了解其他安装说明、基准测试和方法：Semble：<a href="https://github.com/MinishLab/semble" rel="nofollow">https://github.com/MinishLab/semble</a>基准测试：<a href="https://github.com/MinishLab/semble/tree/main/benchmarks" rel="nofollow">https://github.com/MinishLab/semble/tree/main/benchmarks</a>模型：<a href="https://huggingface.co/minishlab/potion-code-16M" rel="nofollow">https://huggingface.co/minishlab/potion-code-16M</a>如有任何反馈或疑问，请随时告知我们！

查看原文

查看缓存全文

缓存时间: 2026/05/17 21:50

快速准确的代码搜索代理，使用的令牌比grep+read少约98%

Show HN: Semble – 面向代理的代码搜索，令牌使用量比 grep 减少 98%

相似文章

@omarsar0: // Is Grep All You Need? // 注意了，AI开发者们。（收藏起来）他们发现，grep风格的文本搜索，当…

Show HN: 轻量级多AI代理对话方案，无需API付费

@HowToAI_: 现在只需一条命令，您就能将 Claude Code 的工具调用次数削减94%。这个 MCP 服务器将您的代码库索引到…

@RoundtableSpace: SocratiCode 为您的 AI 提供对整个代码库的深度语义理解 - 依赖图、符号级影响分析…

Show HN：面向AI代理的Git

提交意见反馈