大多数AI智能体失败的原因在于人们像构建聊天机器人那样构建它们
摘要
许多AI智能体实现失败是因为它们把智能体当作聊天机器人来对待,依赖聊天历史记录来管理状态,而非使用确定性的数据结构。文章提倡将推理(LLM)、动作(工具)、工作流进度(状态机)和外部触发(网络钩子)分开,以构建可靠的业务智能体。
我经常看到一个模式:人们把“AI智能体”构建得像只带有工具的聊天机器人。这在演示中可行。但当工作流需要超过一个会话时就会崩溃。例如:客户入职智能体不应该“记住”它已经发送了欢迎邮件,因为那只是发生在聊天历史的某个地方。它应该知道是因为有一个明确的状态,比如:LEAD_CAPTURED PLAN_SELECTED CONTRACT_SENT CONTRACT_SIGNED PAYMENT_RECEIVED ONBOARDING_STARTED COMPLETED 这个状态应该存在于你的数据库中,而不是模型的记忆里。模型可以推理、写作、总结、调用工具,并决定下一步做什么。但业务流程必须是确定性的。我喜欢的实用架构:使用LLM进行推理和语言。使用工具执行动作。使用状态机管理工作流进度。使用网络钩子/事件来唤醒智能体。使用日志/评估来证明它没有跳过步骤。对于昂贵或高风险的操作,使用人工审批。一个好的智能体不是“一个巨大的提示词”。它更像是一个围绕模型的小型操作系统。这就是一个酷炫的演示和企业真正可以信赖的东西之间的区别。
相似文章
停止构建AI智能体。
作者认为,大多数要求构建AI智能体的创始人实际上只需要简单的自动化流程,并辅以最少的LLM集成,理由包括生产环境故障、合规障碍,以及更简单工作流带来的更高投资回报率。文章提供了一个实用的决策框架,帮助开发者和创始人优先考虑可靠的自动化,而非复杂且不可预测的智能体。
我们的大部分“智能体”问题实际上是工作流/状态问题
一位开发者讲述,构建AI智能体时的许多挑战实际上源于工作流和状态管理问题,而非模型智能,强调了稳健的状态处理和可观测性的必要性。
大多数 AI Agent 的失败是组织设计失败,而非模型失败
文章认为,生产环境中 AI Agent 的失败往往归因于糟糕的组织设计和模糊的责任边界,而非模型本身的局限性。文章提出了一种成熟度模型,区分了 AI 助手、自动化流程和 AI 员工,以指导任务所有权的确立。
我为数十个客户构建了AI代理。以下是大多数在生产中失败的原因(而且不是模型的问题)
一位开发者分享了AI代理在生产中失败的三个常见原因:RAG分块不佳、仅针对演示的提示词、以及缺乏回退逻辑,强调模型质量很少是主要问题。
AI代理没有智能问题,它们有状态管理问题
文章认为,AI代理在生产中的大多数故障是由于不稳定的运行状态和内存退化造成的,而非模型能力不足,并强调需要更好的基础设施来支持状态管理、可观测性和自适应可靠性。