@LearnWithBrij：别再像2022年那样构建RAG了。分块→嵌入→检索→生成这条流水线能用……直到你尝试上线……

X AI KOLs Timeline 2026/06/13 09:58 新闻

rag production retrieval-augmented-generation ai-engineering evaluation query-routing indexing

摘要

一个帖子解释了构建生产级RAG超越简单分块-嵌入-检索-生成所需的四个关键层次：智能查询路由、高级索引、多类型检索和持续评估。

别再像2022年那样构建RAG了。分块→嵌入→检索→生成这条流水线能用…… 直到你尝试将其交付到生产环境。一旦RAG遇到真实用户、真实数据和真实边界情况——它就会崩溃。我列出了生产级RAG实际需要的内容。大多数团队缺少以下4个层次：检索 ≠ 仅限向量搜索并非所有问题都是语义性的。你需要： → 图数据库处理关系型问题 → SQL处理数字和结构化数据 → 向量搜索处理含义单一的搜索引擎无法解决所有这三种问题。智能查询路由（隐藏的超能力）在检索任何内容之前，先判断： → 语义型还是逻辑型？ → 单跳还是多跳？ → 优先访问哪个数据源？仅这一决策层就能消除约80%的错误回答。高级索引（仅分块还不够）简单的分块 = 低召回率。真实系统使用： → 层次化表示（RAPTOR） → 词元级检索（ColBERT） → 同一数据的多视角索引相同的数据。更智能的访问方式。评估循环（不可协商）如果你无法衡量它，就无法修复它。你需要： → 端到端RAG评估（Ragas） → 组件测试（DeepEval） → 持续监控，而非一次性演示没有评估 = 静默幻觉。残酷的事实： RAG不再是一个功能。它是一个工程系统。那些把它当作即插即用API的团队正是那些在问： “为什么我们的AI会产生幻觉？” 演示级RAG和生产级RAG之间的差距就在于这4个层次。构建系统。而不是玩具。 #RAG #LLM #AI工程 #机器学习 #生成式AI #创业 #科技 #软件工程

查看原文

查看缓存全文

缓存时间: 2026/06/14 07:39

不要再用2022年的方式构建RAG。

分块 → 嵌入 → 检索 → 生成
这个流程看似可行……
直到你试图将它部署到生产环境。

当RAG面对真实用户、真实数据和真实边界案例时——就会崩溃。

我梳理了生产级RAG真正需要的东西。
大多数团队都忽略了这4个层面：

检索 ≠ 仅靠向量搜索

并非所有问题都是语义性的。

你需要：
→ 图数据库处理关系型问题
→ SQL处理数值和结构化数据
→ 向量搜索处理语义理解

单一搜索引擎无法解决所有三类问题。

智能查询路由（隐藏的超能力）

在检索任何内容之前，先决策：
→ 语义还是逻辑？
→ 单跳还是多跳？
→ 优先访问哪个数据源？

这一决策层能消除约80%的错误答案。

高级索引（仅分块远远不够）

天真的分块 = 低召回率。

真正的系统使用：
→ 层次化表示（RAPTOR）
→ 令牌级别检索（ColBERT）
→ 同一数据的多视角索引

相同数据，更智能的访问。

评估循环（不可妥协）

无法衡量，就无法改进。

你需要：
→ 端到端RAG评估（Ragas）
→ 组件测试（DeepEval）
→ 持续监控，而非一次性演示

没有评估 = 寂静的幻觉。

残酷真相：

RAG不再是一个功能。
它是一个工程系统。

那些将它当作即插即用API的团队，
正是那些问出：

“为什么我们的AI会产生幻觉？” 的团队。

演示级RAG与生产级RAG之间的鸿沟，
正是这4个层面。

构建系统。
而非玩具。

#RAG #LLM #AIEngineering #MachineLearning #GenAI #Startups #Tech #SoftwareEngineering

@LearnWithBrij：别再像2022年那样构建RAG了。分块→嵌入→检索→生成这条流水线能用……直到你尝试上线……

相似文章

记录了不断破坏我的RAG系统的故障模式：分块、过期索引、混合搜索等

@_avichawla: 面向AI工程师的8种RAG架构：（用法说明）1）Naive RAG——纯粹基于向量相似度检索文档…

@_rohit_tiwari_: 我浪费了几个月试图理解RAG。所以我制作了这个清晰的逐步指南。https://drive.google.com/file/d/1…

@akshay_pachaar: RAG vs. Graph RAG vs. Agentic RAG，清晰说明！标准RAG将文档嵌入向量并检索最相关…

@tom_doerr: 构建RAG系统的分步指南笔记本 https://github.com/langchain-ai/rag-from-scratch…

提交意见反馈