为什么向量RAG在大规模AI编程代理中失败(以及我如何使用Neo4j图来解决它)
摘要
一款名为Writ的新开源工具采用混合检索流程,结合BM25、本地ONNX向量和Neo4j图遍历,为AI编程代理提供上下文规则,将令牌膨胀减少726倍,并通过bash钩子强制计划审批。
每个人都把AI编码记忆当作“第一周”问题,只需将[`CLAUDE.md`](http://CLAUDE.md)文件转储到上下文中。一旦遇到数千条冲突的企业规则,这种方法就会崩溃。渐进式披露仍然会消耗数千个令牌。我想将匹配决策完全移出代理。我强迫一个LLM帮助我构建一个名为Writ的工具。它位于Claude Code之上,使用5阶段混合检索流程(BM25 + 本地ONNX向量 + Neo4j图遍历),在0.55毫秒内返回上下文规则,同时将令牌膨胀减少726倍。最棒的部分?它使用实际的本地bash终端钩子,在有效的计划和测试骨架获得批准之前,剥夺AI的写入权限。不再有AI代理撒谎或幻觉依赖。它完全开源且本地优先。查看架构,并告诉我图遍历逻辑是否有意义:[https://github.com/infinri/Writ](https://github.com/infinri/Writ)
相似文章
我如何在向量存储之上构建图数据库,以支持1000个代理运行2个月,因为仅凭向量搜索在用户偏好随时间变化时会失效。
一份详细的架构指南,介绍如何构建长期运行的AI代理,通过结合向量存储、图数据库和时间边缘(temporal edges)来处理随时间变化的用户偏好,而不是覆盖数据。
@HowToPrompt__:整个向量数据库行业被一个1974年的免费工具打败了。过去两年里,每一家公司……
研究人员报告称,经典的grep命令在自主AI代理的检索任务中胜过现代向量数据库,挑战了当前主流的RAG基础设施方法。
@pauliusztin_: 我花了几个月优化GraphRAG检索。但结果发现我优化错了方向……最大的知识…
一份关于为AI智能体优化知识图谱摄入的详细指南,提出了一个五步流水线(提取、解析、嵌入、去重、路由),以防止图谱损坏并提高检索质量。
@_avichawla: 面向AI工程师的8种RAG架构:(用法说明)1)Naive RAG——纯粹基于向量相似度检索文档…
一个推文串,解释了8种不同的RAG架构(Naive、Multimodal、HyDE、Corrective、Graph、Hybrid、Adaptive、Agentic)及其使用场景,并暗示了一种改进的索引技术。
@tech_with_ram:你的 AI 技术栈有个数据库问题 你需要一个向量数据库来存嵌入。一个图数据库来处理关系。一个应用 …
HelixDB 是一款新的开源数据库,采用 Rust 构建,将向量、图和其他数据模型结合到单一引擎中,由 Y Combinator 支持。它旨在取代 AI 技术栈中独立的向量、图和应用数据库,提供原生向量搜索、图遍历和 MCP 支持。