为什么向量RAG在大规模AI编程代理中失败(以及我如何使用Neo4j图来解决它)

Reddit r/ArtificialInteligence 工具

摘要

一款名为Writ的新开源工具采用混合检索流程,结合BM25、本地ONNX向量和Neo4j图遍历,为AI编程代理提供上下文规则,将令牌膨胀减少726倍,并通过bash钩子强制计划审批。

每个人都把AI编码记忆当作“第一周”问题,只需将[`CLAUDE.md`](http://CLAUDE.md)文件转储到上下文中。一旦遇到数千条冲突的企业规则,这种方法就会崩溃。渐进式披露仍然会消耗数千个令牌。我想将匹配决策完全移出代理。我强迫一个LLM帮助我构建一个名为Writ的工具。它位于Claude Code之上,使用5阶段混合检索流程(BM25 + 本地ONNX向量 + Neo4j图遍历),在0.55毫秒内返回上下文规则,同时将令牌膨胀减少726倍。最棒的部分?它使用实际的本地bash终端钩子,在有效的计划和测试骨架获得批准之前,剥夺AI的写入权限。不再有AI代理撒谎或幻觉依赖。它完全开源且本地优先。查看架构,并告诉我图遍历逻辑是否有意义:[https://github.com/infinri/Writ](https://github.com/infinri/Writ)
查看原文

相似文章