@DivyanshT91162: 人工智能行业花费数十亿美元解决一个52年前的终端命令早已解决的问题。在过去的…
摘要
一条Twitter帖子指出,人工智能行业在RAG的向量检索系统上投入巨资可能并无必要,因为52年前的终端命令'grep'在AI代理上下文中进行精确匹配时表现优于现代语义搜索。
查看缓存全文
缓存时间: 2026/06/18 12:15
AI行业花了数十亿美元解决一个问题,而一个诞生于52年前的终端命令早已解决了它。
过去两年里,RAG(检索增强生成)成了AI记忆问题的默认答案。
需要代理搜索代码库?用嵌入。
需要长期记忆?用向量数据库。
需要检索?构建语义搜索流水线。
整个行业都围绕这个想法建立起来。
然后,研究人员测试了一个简单得令人尴尬的东西:
grep。
同一个自1974年以来开发者一直在用的命令。
他们拿现代向量检索系统与纯文本搜索(用于像Claude Code和Gemini CLI这样的AI代理)做了对比。
结果令人震惊。
grep不仅没落后。
它赢了。
当代理需要精确的变量名、错误信息、函数调用或日志条目时,语义搜索常常返回“相似”结果,而不是正确的那个。
那些额外噪声混淆了代理。
grep正好相反。
不猜。不解释。不分心。
只给精确答案。
最大的教训是什么?
LLM已经提供了智能。
检索系统不需要思考。
它们只需要取数据。
而有时候,一个1974年的工具在完成这一点上,能击败价值数十亿美元的AI堆栈。
链接
论文: https://arxiv.org/pdf/2605.15184
相似文章
@omarsar0: // Is Grep All You Need? // 注意了,AI开发者们。(收藏起来)他们发现,grep风格的文本搜索,当…
PwC的一篇研究论文发现,当正确集成到代理框架中时,grep风格的文本搜索在编码代理任务上可以匹配或超越基于嵌入的检索,这表明向量数据库对许多用例可能并非必需。
@HowToPrompt__:整个向量数据库行业被一个1974年的免费工具打败了。过去两年里,每一家公司……
研究人员报告称,经典的grep命令在自主AI代理的检索任务中胜过现代向量数据库,挑战了当前主流的RAG基础设施方法。
@Suryanshti777: 这太疯狂了 有人终于意识到AI编程代理花费一半的时间在搜索代码库而不是实际…
CodeGraph 为AI编程代理构建了一个本地知识图谱来索引代码库的关系,与传统搜索方法相比,减少了约59%的token使用和约49%的执行时间。
@jerryjliu0:关于grep是否是智能体搜索所需的全部工具,这个问题尚无定论。@PwCUS(Sen等人)最近的这篇论文似乎……
最近的一篇论文研究了在智能体检索中,grep是否优于向量搜索,发现grep在对话记忆测试中具有更高的准确性,但也指出了在企业文档语料库方面的局限性。
@rohanpaul_ai: Anthropic新研究表明,AI智能体在代码方面可能表现卓越,但在生物学领域,它们可能在科学工作开始之前就失败……
Anthropic的研究揭示,AI智能体在生物学数据库方面存在困难,对同一个查询会产生高度差异的答案(例如,埃博拉序列计数范围从5到106,而预期为266),但添加一个可重复的检索工具能显著提高一致性和准确性。