匹配世界顶尖的多跳RAG系统,无需GPU,无需微调,只需pip install
摘要
MOTHRAG是一个多跳RAG系统,仅使用普通API调用即可匹配顶尖GPU依赖系统(HippoRAG 2、CoRAG、NeocorRAG)的性能,无需GPU,无需微调,通过pip install加API密钥即可部署。
暂无内容
查看缓存全文
缓存时间: 2026/06/20 14:29
# 匹敌全球顶尖的多跳RAG系统,无需GPU,无需微调,只需pip安装
来源:https://www.linkedin.com/pulse/matching-worlds-top-multi-hop-rag-systems-gpu-just-pip-geymonat-zbgxe
Julian Geymonat (https://it.linkedin.com/in/julian-geymonat)
### Julian Geymonat
发表于 2026年6月19日
以下三个系统(HippoRAG 2、CoRAG、NeocorRAG)是目前最强的多跳问答框架之一。它们每一个都依赖GPU、微调或约束解码才能达到这一水平。
而MOTHRAG在F1分数上与它们并驾齐驱,同时完全运行在商用API调用之上。无需GPU,无需微调,无需约束解码,也没有非商业许可证限制。
系统 | 部署方式 | HotpotQA | 2Wiki | MuSiQue | 平均分
HippoRAG 2 | 离线图谱 + GPU | 75.5 | 71.0 | 48.6 | 65.0
CoRAG | 训练式检索 | 75.1 | 75.1 | 52.9 | 67.7
NeocorRAG | GPU约束解码 | 78.3 | 76.1 | 52.6 | 69.0
MOTHRAG(我们的)| 仅商用API | 78.1 | 76.3 | 50.5 | 68.3
在可商业部署的框架中平均F1最高,与受GPU限制的最先进技术相差不到0.7个点,并且在2Wiki上领先于它。重点不在于打败这些系统,而在于用它们的基础设施中任何一项都不需要的情况下达到同等水平。
部署方式就是pip安装加上API密钥:
pip install mothrag
from mothrag import MothRAG
m = MothRAG.from_documents(["巴黎是法国的首都。", "埃菲尔铁塔在巴黎。"])
result = m.query("埃菲尔铁塔在哪个国家?")
print(result.answer)
print(result.confidence)
整个流程是完全模块化的。阅读器、嵌入器和检索判断器都可以在不重新训练的情况下互换,作为可选依赖安装:gemini/openai用于API阅读器和嵌入器,sentence-transformers用于本地嵌入回退,faiss用于超过10万到1000万个块规模的向量存储,retrieval用于经典的BM25/图谱功能,prod用于完整技术栈。
一个单标志的经济层级可以切换检索判断器,将每次查询成本从约$0.032降低到约$0.018,同时在HotpotQA和2Wiki上保持统计上的同等性能。
每个答案都采用证明树结构,因此你可以检查每一个推理步骤,并且论文中每个表格背后的每一次查询输出都已发布,供你验证数据。
欢迎就流程或判断器设计提问。
## Julian Geymonat 的更多文章
## 探索内容分类
相似文章
@yoginth: 今天我推出了 http://rag.computer,这是一个基于 @turbopuffer 构建的开源 RAG 平台,支持快速数据摄入、快速检索……
bigRAG 是一个基于 Turbopuffer 构建的开源 RAG 平台,支持快速数据摄入与检索,并兼容多种文档格式和嵌入模型。
@hasantoxr: 我在自己的笔记本电脑上搭建了一个RAG系统,绝不会向OpenAI发送一个字节。100%离线。100%开源。以下是……
一位用户在自己的笔记本电脑上搭建了一个完全离线、完全开源的RAG系统,强调不会向OpenAI发送任何数据。他们提供了一个6步指南。
从RAG到记忆:大型语言模型的非参数持续学习
HippoRAG 2通过更深入的段落整合和更有效的LLM使用改进了RAG,在事实性、意义构建和联想记忆任务上全面优于标准RAG,实现了非参数持续学习。
RAG-Anything:全能型 RAG 框架
RAG-Anything 是一个全新的开源框架,通过整合跨模态关系和语义匹配来增强多模态知识检索,在复杂的基准测试中表现优于现有方法。
移动NPU上的能效型端侧RAG:Snapdragon X Elite系统设计与基准测试
本文介绍了首个完全运行在移动NPU(Snapdragon X Elite上的Qualcomm Hexagon)上的端到端RAG流水线,相比CPU实现了高达18倍的LLM预填充加速和4倍的能耗降低,且无质量退化。