Witchcraft：基于SQLite的快速本地语义搜索 [P]

Reddit r/MachineLearning 2026/05/18 16:00 工具

semantic-search sqlite rust open-source local-search cli embeddings

摘要

Witchcraft 是一个用 Rust 对斯坦福大学 XTR-Warp 语义搜索引擎进行的开源重新实现，使用 SQLite 实现快速本地搜索。它包含 Pickbrain CLI，用于索引代码会话记录，并为 AI 代理配备全局记忆。

**Witchcraft (https://github.com/dropbox/witchcraft)** 是我在 Dropbox 构建的一个开源项目，它用安全 Rust 语言从零重新实现了斯坦福大学的 XTR-Warp 语义搜索引擎（ [https://github.com/jlscheerer/xtr-warp](https://github.com/jlscheerer/xtr-warp) ），使用单文件 SQLite 数据库作为后端存储，使其适用于客户端部署。它完全独立运行在你的设备上，无需 API 密钥、无需向量数据库、无需分块策略、无需花哨的重排序器，并且速度极快（在 Apple Macbook Pro M2 Max 上，对 NFCorpus 数据集，端到端搜索延迟 95 分位值为 20 毫秒，NDCG@10 为 33%，比原始 XTR-WARP 在服务器级硬件上快两倍以上，精度相近）。该项目还包含 **Pickbrain**，一个 CLI 工具，用于将你的 Claude Code 和 OpenAI Codex 会话记录、记忆文件以及撰写的文档索引到 Witchcraft 数据库中，实现快速语义搜索。你是否曾想过“修复 auth 中间件的那段对话是什么？”—— pickbrain 能找到它，并让你直接恢复该会话。此外，还为 Claude 和 Codex 提供了一个 /pickbrain 技能，能为这些工具配备跨所有会话的全局记忆。你可以直接从命令行使用 pickbrain，例如重新发现之前的代理会话并直接恢复，或者让你的代理通过提供的技能调用它，例如“使用 /pickbrain 查阅我们之前在 XTR 令牌掩码训练方面的努力”，从而轻松地将之前的上下文填入新会话。

查看原文

Witchcraft：基于SQLite的快速本地语义搜索 [P]

相似文章

@eladgil: https://x.com/eladgil/status/2079561730263531771

6倍更快的二分查找：从编译代码到机械共鸣

@omarsar0：推荐阅读。（收藏）注意价格以及模型组合能为你解锁什么。你……

重新思考 Search as Code Generation (25分钟阅读)

@techwith_ram：一个1000万文档的语料库以float32格式占用31GB内存。大多数团队遇到这一瓶颈后会转向托管向量数据库。每月400美元……

提交意见反馈