AI智能体中最无聊的部分:没人构建,人人都需要

Reddit r/artificial 新闻

摘要

一位实践者回顾了在生产环境中部署AI智能体的经历,指出80%的工程精力花费在工作流、所有权和审批流程上,而非模型本身。他强调,共享上下文和路由这些“无聊层”对于产生实际影响至关重要。

去年我在一家营收6200万美元的公司领导了一个AI加速项目。我们向生产环境交付了两个智能体:欺诈检测和发布商优化。两者都在运行,都已上线。吞噬了80%工程时间的不是模型。不是提示词。不是数据管道。而是工作流。当欺诈智能体标记了一个可疑的发布商网络时,谁会收到警报?是那个本该发现它的分析师?还是负责审核季度报告的经理?或者是我?没有明确的所有权,智能体的发现只会烂在Slack频道里。我们在第一个月就学到了这个教训。智能体揭示了一个跨越三个市场的模式。四名分析师数月未能发现。浪费了3万美元的广告支出。花了三天才行动,因为没人知道谁拥有这个输出。最终我们构建了我称之为“枯燥层”的东西:每个智能体都读取和写入的共享上下文、实际人类参与的审批流程、升级规则、审计线索。基本上就是电子表格。不是演示材料。AI智能体的演示版本是一个施展魔法的聊天机器人。而生产版本是20%的模型和80%的流程工程。路由决策、所有权分配、智能体出错时的错误处理。如果你跳过这一层,智能体就只是昂贵的Slack噪音。
查看原文

相似文章

Agent工程中的枯燥部分

Reddit r/AI_Agents

作者讨论了在生产中构建可靠AI Agent时那些不引人注目但至关重要的方面,包括监控运行中的进程、恢复失败的任务以及提供UI状态,并向社区询问常见的痛点和现成的解决方案。

关于 AI 智能体的真实内情

Reddit r/AI_Agents

一位资深从业者分享了将 25 个以上 AI 智能体部署到生产环境的经验教训,指出记忆、编排和可审计性远比模型选择重要。文章详细介绍了上下文丢失、静默成本循环等常见故障模式,并推荐了包含 Claude Sonnet 4、Pydantic AI 以及 Octopodas 等专用记忆层的技术栈。