@lidangzzz: 我去年就跟你们说,用RAG和vector database一定是死路一条。正确做法是, 1. 正确用好memory; 2. 正确把内容分块,做好indexing,做好summarization; 3. 正确给agent提供search工具…
摘要
作者批评RAG和向量数据库的方法,提出正确的做法包括用好memory、分块和索引、摘要、为agent提供搜索工具,以及使用SRAM-only推理服务如Groq和Cerebras。
查看缓存全文
缓存时间: 2026/07/04 14:47
我去年就跟你们说,用RAG和vector database一定是死路一条。正确做法是,
- 正确用好memory;
- 正确把内容分块,做好indexing,做好summarization;
- 正确给agent提供search工具,让agent甚至multi agent自己模糊搜索;
- 用更快的、我推荐过几十次的SRAM-only inference model provider, 比如groq、cerebras这些。
这些无论哪一个,都比无脑分块、无脑喂给vector database、无脑RAG要强一万多倍。
相似文章
@vintcessun: RAG喂太多文档,检索质量反而从75%掉到40%?向量搜索被大量无关内容稀释,真实部署中命中率暴跌。 问题根源:异构文档混在一起检索,噪声淹没了信号。多智能体编排看似智能,实际引入精度-忠实度悖论——配置稍差就两头不讨好。 论文提出的MA…
This paper identifies 'vector search dilution' in RAG systems when scaling to large heterogeneous document collections, where accuracy dropped from 75% to 40% in a real-world deployment. The proposed MASDR-RAG method uses domain scoping via organizational metadata before retrieval, improving P@10 from 0.77 to 0.86 with low cost and easy deployment.
@yibie: 推荐这篇,交大和清华的团队系统测评了 12 种 Agent 记忆系统。不是那种"我们的模型更好"的论文,而是从数据管理的角度拆解记忆系统怎么选——什么时候该用 RAG、什么时候该用向量数据库、什么时候该用知识图谱。 Agent 的长期记忆…
This paper from SJTU and Tsinghua systematically evaluates 12 agent memory systems from a data management perspective, decomposing memory into four modules and providing guidelines on when to use RAG, vector databases, or knowledge graphs for long-term agent memory.
@freeman1266: 普通 RAG vs 知识图谱 RAG vs LLM Wiki——三种知识库检索方案,95% 的人选错了,不是因为不懂,是因为没认清自己的数据形态。 三句话讲清楚: 普通 RAG:把文档切成 chunk,向量化入库,问题来了找相似片段喂给 …
本文对比了普通RAG、知识图谱RAG和LLM Wiki三种知识库检索方案的适用场景与选型建议,强调根据数据形态选择正确方案,避免盲目使用复杂工具。
@aikangarooking: https://x.com/aikangarooking/status/2069325659105861926
介绍了SAG(SQL-Retrieval Augmented Generation),一种基于SQL动态超边的新型检索增强生成架构,相比传统RAG和GraphRAG在多跳推理上更高效、成本更低,已在GitHub开源并取得不错评测结果。
我见到的大多数智能体RAG问题都是检索问题,而非模型问题
作者认为大多数智能体RAG失败源于检索问题——具体包括分块错误、缺乏新鲜度信号以及依赖纯向量搜索——而非大语言模型本身,并建议采用结构化分块、基于衰减的排序以及BM25+向量的混合搜索。