我为数十个客户构建了AI代理。以下是大多数在生产中失败的原因（而且不是模型的问题）

Reddit r/artificial 2026/06/01 11:56 新闻

ai-agents production-failures rag chunking prompt-engineering fallback-logic best-practices

摘要

一位开发者分享了AI代理在生产中失败的三个常见原因：RAG分块不佳、仅针对演示的提示词、以及缺乏回退逻辑，强调模型质量很少是主要问题。

我看到很多人部署的AI代理在演示中完美运行，但一旦真实用户使用就会崩溃。在为多个客户构建自动化系统后，我注意到失败几乎从来不是因为选错了LLM，而是来自三个方面：**1. RAG管道中的分块不佳。** 每个人都太专注于选择合适的向量数据库，以至于没有考虑如何拆分文档。垃圾进，垃圾出。如果你的分块没有跨句子保留上下文，检索效果永远只是一般。**2. 为演示编写的提示词，而非边缘情况。** 演示输入是干净的。真实用户输入则是奇怪的、模糊的，有时甚至是故意破坏的。如果你没有用糟糕的输入对提示词进行压力测试，它会在公开场合失败。**3. 缺乏回退逻辑。** 当代理困惑时，它该怎么办？大多数开发者从未回答这个问题。于是代理要么自信地产生幻觉，要么什么都不返回。两者都不好。模型通常是最不应该被指责的。先修复基础架构。有人也遇到这种情况吗？很好奇你见过的失败模式。https://preview.redd.it/vd9yyzkpzn4h1.png?width=1536&format=png&auto=webp&s=e81e5a1b4a7c4d82542c8cbc5cdf9712f30ff393

查看原文

我为数十个客户构建了AI代理。以下是大多数在生产中失败的原因（而且不是模型的问题）

相似文章

为什么AI代理在演示中表现完美，但在真实客户面前却崩盘

我觉得没人讨论大多数AI代理在现实世界中失败的真实原因

生产环境中的AI代理：演示中绝不会提及的失败模式

我在AI项目中经常看到但没人公开讨论的事情

你的代理失败不是因为模型，而是因为没人构建一个停止按钮

提交意见反馈