sram-inference

标签

Cards List
#sram-inference

@lidangzzz: 我去年就跟你们说,用RAG和vector database一定是死路一条。正确做法是, 1. 正确用好memory; 2. 正确把内容分块,做好indexing,做好summarization; 3. 正确给agent提供search工具…

X AI KOLs Timeline · 昨天 缓存

作者批评RAG和向量数据库的方法,提出正确的做法包括用好memory、分块和索引、摘要、为agent提供搜索工具,以及使用SRAM-only推理服务如Groq和Cerebras。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈