为什么向量RAG在大规模AI编程代理中失败（以及我如何使用Neo4j图来解决它）

Reddit r/ArtificialInteligence 2026/05/18 20:02 工具

ai-coding retrieval-augmented-generation neo4j graph-database vector-search open-source local-first

摘要

一款名为Writ的新开源工具采用混合检索流程，结合BM25、本地ONNX向量和Neo4j图遍历，为AI编程代理提供上下文规则，将令牌膨胀减少726倍，并通过bash钩子强制计划审批。

每个人都把AI编码记忆当作“第一周”问题，只需将[`CLAUDE.md`](http://CLAUDE.md)文件转储到上下文中。一旦遇到数千条冲突的企业规则，这种方法就会崩溃。渐进式披露仍然会消耗数千个令牌。我想将匹配决策完全移出代理。我强迫一个LLM帮助我构建一个名为Writ的工具。它位于Claude Code之上，使用5阶段混合检索流程（BM25 + 本地ONNX向量 + Neo4j图遍历），在0.55毫秒内返回上下文规则，同时将令牌膨胀减少726倍。最棒的部分？它使用实际的本地bash终端钩子，在有效的计划和测试骨架获得批准之前，剥夺AI的写入权限。不再有AI代理撒谎或幻觉依赖。它完全开源且本地优先。查看架构，并告诉我图遍历逻辑是否有意义：[https://github.com/infinri/Writ](https://github.com/infinri/Writ)

查看原文

为什么向量RAG在大规模AI编程代理中失败（以及我如何使用Neo4j图来解决它）

相似文章

我如何在向量存储之上构建图数据库，以支持1000个代理运行2个月，因为仅凭向量搜索在用户偏好随时间变化时会失效。

@HowToPrompt__：整个向量数据库行业被一个1974年的免费工具打败了。过去两年里，每一家公司……

@pauliusztin_: 我花了几个月优化GraphRAG检索。但结果发现我优化错了方向……最大的知识…

@_avichawla: 面向AI工程师的8种RAG架构：（用法说明）1）Naive RAG——纯粹基于向量相似度检索文档…

@tech_with_ram：你的 AI 技术栈有个数据库问题你需要一个向量数据库来存嵌入。一个图数据库来处理关系。一个应用 …

提交意见反馈