@lidangzzz: 我去年就跟你们说,用RAG和vector database一定是死路一条。正确做法是, 1. 正确用好memory; 2. 正确把内容分块,做好indexing,做好summarization; 3. 正确给agent提供search工具…

X AI KOLs Timeline 新闻

摘要

作者批评RAG和向量数据库的方法,提出正确的做法包括用好memory、分块和索引、摘要、为agent提供搜索工具,以及使用SRAM-only推理服务如Groq和Cerebras。

我去年就跟你们说,用RAG和vector database一定是死路一条。正确做法是, 1. 正确用好memory; 2. 正确把内容分块,做好indexing,做好summarization; 3. 正确给agent提供search工具,让agent甚至multi agent自己模糊搜索; 4. 用更快的、我推荐过几十次的SRAM-only inference model provider, 比如groq、cerebras这些。 这些无论哪一个,都比无脑分块、无脑喂给vector database、无脑RAG要强一万多倍。
查看原文
查看缓存全文

缓存时间: 2026/07/04 14:47

我去年就跟你们说,用RAG和vector database一定是死路一条。正确做法是,

  1. 正确用好memory;
  2. 正确把内容分块,做好indexing,做好summarization;
  3. 正确给agent提供search工具,让agent甚至multi agent自己模糊搜索;
  4. 用更快的、我推荐过几十次的SRAM-only inference model provider, 比如groq、cerebras这些。

这些无论哪一个,都比无脑分块、无脑喂给vector database、无脑RAG要强一万多倍。

相似文章

@vintcessun: RAG喂太多文档,检索质量反而从75%掉到40%?向量搜索被大量无关内容稀释,真实部署中命中率暴跌。 问题根源:异构文档混在一起检索,噪声淹没了信号。多智能体编排看似智能,实际引入精度-忠实度悖论——配置稍差就两头不讨好。 论文提出的MA…

X AI KOLs Timeline

This paper identifies 'vector search dilution' in RAG systems when scaling to large heterogeneous document collections, where accuracy dropped from 75% to 40% in a real-world deployment. The proposed MASDR-RAG method uses domain scoping via organizational metadata before retrieval, improving P@10 from 0.77 to 0.86 with low cost and easy deployment.

@yibie: 推荐这篇,交大和清华的团队系统测评了 12 种 Agent 记忆系统。不是那种"我们的模型更好"的论文,而是从数据管理的角度拆解记忆系统怎么选——什么时候该用 RAG、什么时候该用向量数据库、什么时候该用知识图谱。 Agent 的长期记忆…

X AI KOLs Timeline

This paper from SJTU and Tsinghua systematically evaluates 12 agent memory systems from a data management perspective, decomposing memory into four modules and providing guidelines on when to use RAG, vector databases, or knowledge graphs for long-term agent memory.

@freeman1266: 普通 RAG vs 知识图谱 RAG vs LLM Wiki——三种知识库检索方案,95% 的人选错了,不是因为不懂,是因为没认清自己的数据形态。 三句话讲清楚: 普通 RAG:把文档切成 chunk,向量化入库,问题来了找相似片段喂给 …

X AI KOLs Timeline

本文对比了普通RAG、知识图谱RAG和LLM Wiki三种知识库检索方案的适用场景与选型建议,强调根据数据形态选择正确方案,避免盲目使用复杂工具。