@lidangzzz: 我去年就跟你们说，用RAG和vector database一定是死路一条。正确做法是， 1. 正确用好memory； 2. 正确把内容分块，做好indexing，做好summarization； 3. 正确给agent提供search工具…

X AI KOLs Timeline 2026/07/03 12:56 新闻

rag vector-database memory indexing summarization agent sram-inference

摘要

作者批评RAG和向量数据库的方法，提出正确的做法包括用好memory、分块和索引、摘要、为agent提供搜索工具，以及使用SRAM-only推理服务如Groq和Cerebras。

我去年就跟你们说，用RAG和vector database一定是死路一条。正确做法是， 1. 正确用好memory； 2. 正确把内容分块，做好indexing，做好summarization； 3. 正确给agent提供search工具，让agent甚至multi agent自己模糊搜索； 4. 用更快的、我推荐过几十次的SRAM-only inference model provider，比如groq、cerebras这些。这些无论哪一个，都比无脑分块、无脑喂给vector database、无脑RAG要强一万多倍。

查看原文

查看缓存全文

缓存时间: 2026/07/04 14:47

我去年就跟你们说，用RAG和vector database一定是死路一条。正确做法是，

正确用好memory；
正确把内容分块，做好indexing，做好summarization；
正确给agent提供search工具，让agent甚至multi agent自己模糊搜索；
用更快的、我推荐过几十次的SRAM-only inference model provider，比如groq、cerebras这些。

这些无论哪一个，都比无脑分块、无脑喂给vector database、无脑RAG要强一万多倍。

相似文章

@vintcessun: RAG喂太多文档，检索质量反而从75%掉到40%？向量搜索被大量无关内容稀释，真实部署中命中率暴跌。问题根源：异构文档混在一起检索，噪声淹没了信号。多智能体编排看似智能，实际引入精度-忠实度悖论——配置稍差就两头不讨好。论文提出的MA…

X AI KOLs Timeline

This paper identifies 'vector search dilution' in RAG systems when scaling to large heterogeneous document collections, where accuracy dropped from 75% to 40% in a real-world deployment. The proposed MASDR-RAG method uses domain scoping via organizational metadata before retrieval, improving P@10 from 0.77 to 0.86 with low cost and easy deployment.

@yibie: 推荐这篇，交大和清华的团队系统测评了 12 种 Agent 记忆系统。不是那种"我们的模型更好"的论文，而是从数据管理的角度拆解记忆系统怎么选——什么时候该用 RAG、什么时候该用向量数据库、什么时候该用知识图谱。 Agent 的长期记忆…

X AI KOLs Timeline

This paper from SJTU and Tsinghua systematically evaluates 12 agent memory systems from a data management perspective, decomposing memory into four modules and providing guidelines on when to use RAG, vector databases, or knowledge graphs for long-term agent memory.

@freeman1266: 普通 RAG vs 知识图谱 RAG vs LLM Wiki——三种知识库检索方案，95% 的人选错了，不是因为不懂，是因为没认清自己的数据形态。三句话讲清楚：普通 RAG：把文档切成 chunk，向量化入库，问题来了找相似片段喂给 …

X AI KOLs Timeline

本文对比了普通RAG、知识图谱RAG和LLM Wiki三种知识库检索方案的适用场景与选型建议，强调根据数据形态选择正确方案，避免盲目使用复杂工具。

@aikangarooking: https://x.com/aikangarooking/status/2069325659105861926

X AI KOLs Timeline

介绍了SAG（SQL-Retrieval Augmented Generation），一种基于SQL动态超边的新型检索增强生成架构，相比传统RAG和GraphRAG在多跳推理上更高效、成本更低，已在GitHub开源并取得不错评测结果。

我见到的大多数智能体RAG问题都是检索问题，而非模型问题

Reddit r/AI_Agents

作者认为大多数智能体RAG失败源于检索问题——具体包括分块错误、缺乏新鲜度信号以及依赖纯向量搜索——而非大语言模型本身，并建议采用结构化分块、基于衰减的排序以及BM25+向量的混合搜索。

相似文章

@freeman1266: 普通 RAG vs 知识图谱 RAG vs LLM Wiki——三种知识库检索方案，95% 的人选错了，不是因为不懂，是因为没认清自己的数据形态。 三句话讲清楚： 普通 RAG：把文档切成 chunk，向量化入库，问题来了找相似片段喂给 …

@aikangarooking: https://x.com/aikangarooking/status/2069325659105861926

我见到的大多数智能体RAG问题都是检索问题，而非模型问题

提交意见反馈

@freeman1266: 普通 RAG vs 知识图谱 RAG vs LLM Wiki——三种知识库检索方案，95% 的人选错了，不是因为不懂，是因为没认清自己的数据形态。三句话讲清楚：普通 RAG：把文档切成 chunk，向量化入库，问题来了找相似片段喂给 …