@sitinme: Github 30k star,不用向量数据库也能做 RAG,而且准确率还更高! 做 RAG 的人应该都有过这种体验:向量数据库返回的内容“看起来相关”,但就是不是你要的那个答案。 特别是处理合同、财报、技术手册这类长文档的时候,你问“第…
摘要
介绍一个GitHub上30k star的开源项目,通过推理而非向量数据库实现RAG,号称准确率更高,解决了向量检索中相似不等于相关的问题。
Github 30k star,不用向量数据库也能做 RAG,而且准确率还更高! 做 RAG 的人应该都有过这种体验:向量数据库返回的内容“看起来相关”,但就是不是你要的那个答案。 特别是处理合同、财报、技术手册这类长文档的时候,你问“第三季度营收是多少”,它给你返回一段“公司业务概述”。 相似 ≠ 相关,这是向量检索的根本问题。PageIndex 的解法很简单粗暴:不用向量,用推理。
相似文章
@freeman1266: 普通 RAG vs 知识图谱 RAG vs LLM Wiki——三种知识库检索方案,95% 的人选错了,不是因为不懂,是因为没认清自己的数据形态。 三句话讲清楚: 普通 RAG:把文档切成 chunk,向量化入库,问题来了找相似片段喂给 …
本文对比了普通RAG、知识图谱RAG和LLM Wiki三种知识库检索方案的适用场景与选型建议,强调根据数据形态选择正确方案,避免盲目使用复杂工具。
[P] 我构建了一个系统,让你可以对任何GitHub仓库提问,并获得基于实际源代码的答案 [P]
GitRAG 是一个工具,允许用户粘贴任何公开的 GitHub URL,并询问关于代码库的问题,返回基于源代码的答案,带有精确的文件路径和行号,使用了AST感知的切分、混合搜索(稠密检索 + BM25)、重新排序以及用于生成的语言模型。
@Luckyjudy666: 这个名为 Understand-Anything 的开源项目,正成为Github热度榜第一,狂揽2.2万颗星。 它是一个强大的 AI 辅助工具,能够将任何代码库、知识库或文档转化为可交互的、可视化的知识图谱。 1. 功能亮点: 多智能体协…
Understand-Anything 是一个开源的 AI 辅助工具,能将代码库、知识库或文档转化为交互式可视化知识图谱,支持多智能体协作与主流 AI 工具集成,已在 GitHub 获得 2.2 万星。
@axichuhai: 卧槽,有个编程大神把自己的工程经验蒸馏成了一个开源项目 GitHub 热榜第一,Star数直接冲上了9万 + 作者是前 Vercel 工程师 Mat,参与过 Next.js 早期开发,以把复杂技术讲得通俗易懂著称。 他把日常和 Claud…
介绍一个登顶GitHub热榜的开源项目hello-agents,它系统整理了AI和Agent从理论到实践的课程,涵盖Agentic RL、SFT、GRPO等技能,由前Vercel工程师Mat参与,将工程经验蒸馏为16个skill,如Grim提示词技巧和红绿循环测试方法。
@yaohui12138: Karpathy 发布了一个github开源项目,狠狠让我惊艳到了 这个项目叫 andrej-karpathy-skills,GitHub 13 万+ star,我愿称之为2026 最有用的 AI 工程项目 它解决的问题极其精准:让 Cl…
Karpathy 发布了名为 andrej-karpathy-skills 的开源项目,核心是一个 4KB 的 CLAUDE.md 文件,包含 4 条行为准则(先思考再动手、极简实现优先、手术式精准修改、目标驱动执行),能显著降低 AI 编码错误率(最高下降 90%),提升代码质量和开发效率。