我们开源了一个无图的多跳RAG框架——在基准测试上匹配Graph-RAG的准确率,无需重建成本(Apache-2.0)

Reddit r/AI_Agents 工具

摘要

MOTHRAG是一个无图的多跳RAG框架,在基准测试上匹配GraphRAG和HippoRAG等基于图的系统的准确率,同时通过使用密集索引和查询时编排避免昂贵的图重建。

我们刚刚开源了MOTHRAG——一个完全跳过知识图谱的多跳RAG框架。我们一直遇到的问题:准确的多跳系统(GraphRAG、HippoRAG、RAPTOR)都需要离线构建图,每次数据变化时都要重建。对于频繁更新的语料库,这意味着一笔持续的重索引成本。MOTHRAG转而使用无图的密集索引和查询时编排,无需图,无需GPU,每个组件都通过商品化API提供。在多跳基准测试中,它匹配了基于图的系统的准确率,更新只需嵌入并追加,而不是完全重建。基准测试结果:MOTHRAG(我们的) GraphRAG HippoRAG RAPTOR HotpotQA 78.1 68.6 75.5 69.5 2WikiMultiHop 76.3 58.6 71.0 52.1 MuSiQue 50.5 38.5 48.6 28.9 采用Apache-2.0许可证,通过pip install + API密钥即可运行。目前我们诚实的弱点是:MuSiQue上的召回瓶颈,不过我们仍在努力解决。仓库链接在评论中。欢迎在生产环境中对变化数据运行RAG的各位提供反馈!
查看原文

相似文章

RAG-Anything:全能型 RAG 框架

Papers with Code Trending

RAG-Anything 是一个全新的开源框架,通过整合跨模态关系和语义匹配来增强多模态知识检索,在复杂的基准测试中表现优于现有方法。