@LearnWithBrij:别再像2022年那样构建RAG了。分块→嵌入→检索→生成 这条流水线能用……直到你尝试上线……

X AI KOLs Timeline 新闻

摘要

一个帖子解释了构建生产级RAG超越简单分块-嵌入-检索-生成所需的四个关键层次:智能查询路由、高级索引、多类型检索和持续评估。

别再像2022年那样构建RAG了。 分块→嵌入→检索→生成 这条流水线能用…… 直到你尝试将其交付到生产环境。 一旦RAG遇到真实用户、真实数据和真实边界情况——它就会崩溃。 我列出了生产级RAG实际需要的内容。 大多数团队缺少以下4个层次: 检索 ≠ 仅限向量搜索 并非所有问题都是语义性的。 你需要: → 图数据库处理关系型问题 → SQL处理数字和结构化数据 → 向量搜索处理含义 单一的搜索引擎无法解决所有这三种问题。 智能查询路由(隐藏的超能力) 在检索任何内容之前,先判断: → 语义型还是逻辑型? → 单跳还是多跳? → 优先访问哪个数据源? 仅这一决策层就能消除约80%的错误回答。 高级索引(仅分块还不够) 简单的分块 = 低召回率。 真实系统使用: → 层次化表示(RAPTOR) → 词元级检索(ColBERT) → 同一数据的多视角索引 相同的数据。更智能的访问方式。 评估循环(不可协商) 如果你无法衡量它,就无法修复它。 你需要: → 端到端RAG评估(Ragas) → 组件测试(DeepEval) → 持续监控,而非一次性演示 没有评估 = 静默幻觉。 残酷的事实: RAG不再是一个功能。 它是一个工程系统。 那些把它当作即插即用API的团队 正是那些在问: “为什么我们的AI会产生幻觉?” 演示级RAG和生产级RAG之间的差距 就在于这4个层次。 构建系统。 而不是玩具。 #RAG #LLM #AI工程 #机器学习 #生成式AI #创业 #科技 #软件工程
查看原文
查看缓存全文

缓存时间: 2026/06/14 07:39

不要再用2022年的方式构建RAG。

分块 → 嵌入 → 检索 → 生成
这个流程看似可行……
直到你试图将它部署到生产环境。

当RAG面对真实用户、真实数据和真实边界案例时——就会崩溃。

我梳理了生产级RAG真正需要的东西。
大多数团队都忽略了这4个层面:

检索 ≠ 仅靠向量搜索

并非所有问题都是语义性的。

你需要:
→ 图数据库处理关系型问题
→ SQL处理数值和结构化数据
→ 向量搜索处理语义理解

单一搜索引擎无法解决所有三类问题。

智能查询路由(隐藏的超能力)

在检索任何内容之前,先决策:
→ 语义还是逻辑?
→ 单跳还是多跳?
→ 优先访问哪个数据源?

这一决策层能消除约80%的错误答案。

高级索引(仅分块远远不够)

天真的分块 = 低召回率。

真正的系统使用:
→ 层次化表示(RAPTOR)
→ 令牌级别检索(ColBERT)
→ 同一数据的多视角索引

相同数据,更智能的访问。

评估循环(不可妥协)

无法衡量,就无法改进。

你需要:
→ 端到端RAG评估(Ragas)
→ 组件测试(DeepEval)
→ 持续监控,而非一次性演示

没有评估 = 寂静的幻觉。

残酷真相:

RAG不再是一个功能。
它是一个工程系统。

那些将它当作即插即用API的团队,
正是那些问出:

“为什么我们的AI会产生幻觉?” 的团队。

演示级RAG与生产级RAG之间的鸿沟,
正是这4个层面。

构建系统。
而非玩具。

#RAG #LLM #AIEngineering #MachineLearning #GenAI #Startups #Tech #SoftwareEngineering

相似文章