AI智能体中最无聊的部分:没人构建,人人都需要
摘要
一位实践者回顾了在生产环境中部署AI智能体的经历,指出80%的工程精力花费在工作流、所有权和审批流程上,而非模型本身。他强调,共享上下文和路由这些“无聊层”对于产生实际影响至关重要。
去年我在一家营收6200万美元的公司领导了一个AI加速项目。我们向生产环境交付了两个智能体:欺诈检测和发布商优化。两者都在运行,都已上线。吞噬了80%工程时间的不是模型。不是提示词。不是数据管道。而是工作流。当欺诈智能体标记了一个可疑的发布商网络时,谁会收到警报?是那个本该发现它的分析师?还是负责审核季度报告的经理?或者是我?没有明确的所有权,智能体的发现只会烂在Slack频道里。我们在第一个月就学到了这个教训。智能体揭示了一个跨越三个市场的模式。四名分析师数月未能发现。浪费了3万美元的广告支出。花了三天才行动,因为没人知道谁拥有这个输出。最终我们构建了我称之为“枯燥层”的东西:每个智能体都读取和写入的共享上下文、实际人类参与的审批流程、升级规则、审计线索。基本上就是电子表格。不是演示材料。AI智能体的演示版本是一个施展魔法的聊天机器人。而生产版本是20%的模型和80%的流程工程。路由决策、所有权分配、智能体出错时的错误处理。如果你跳过这一层,智能体就只是昂贵的Slack噪音。
相似文章
Agent工程中的枯燥部分
作者讨论了在生产中构建可靠AI Agent时那些不引人注目但至关重要的方面,包括监控运行中的进程、恢复失败的任务以及提供UI状态,并向社区询问常见的痛点和现成的解决方案。
关于 AI 智能体的真实内情
一位资深从业者分享了将 25 个以上 AI 智能体部署到生产环境的经验教训,指出记忆、编排和可审计性远比模型选择重要。文章详细介绍了上下文丢失、静默成本循环等常见故障模式,并推荐了包含 Claude Sonnet 4、Pydantic AI 以及 Octopodas 等专用记忆层的技术栈。
为什么AI Agent原型感觉很棒,但生产部署却变成一团糟
作者分享了将AI Agent系统从沙盒迁移到生产环境的经验,强调了当Agent执行任务时,人类角色变得模糊,团队脱离参与,导致运营失败。
我们的大部分“智能体”问题实际上是工作流/状态问题
一位开发者讲述,构建AI智能体时的许多挑战实际上源于工作流和状态管理问题,而非模型智能,强调了稳健的状态处理和可观测性的必要性。
AI智能体在实际工作流中真正失败的地方(非演示环境)
讨论AI智能体在实际工作流中失败的地方,重点指出协调问题、混乱输入下的可靠性问题,以及在生产中减少人工干预的挑战。