停止构建自主电子邮件代理
摘要
作者基于实际失败案例,反对构建完全自主的电子邮件代理,主张采用受限的“提议-批准”工作流,即AI准备上下文和草稿,但由人类最终批准发送。
每周都有一位创始人联系我,想要一个“能管理我收件箱的AI”。而我每周都得劝说他们放弃自主版本,转向一个更乏味但实际有效的方法。我为创始人和小团队构建AI工作流,现在已经做了三十多个。模式如此一致,我甚至能在对话开始前就预判到。他们来的时候都怀着梦想,看过某个演示——某人的“AI行政主管”自动分类、回复、安排会议,在他们睡觉时把收件箱清空到零。他们想要那个效果。然后我们实际花十分钟看看他们的邮件,我得解释为什么他们真正需要的是一个能起草和提议的助手,而他们自己仍然要点击发送。你可以实时看到他们的失望。实际情况是,目前正在交付的大多数“自主收件箱代理”距离搞砸一段客户关系只有一条糟糕回复的距离,而这段关系是主人花了两年时间建立的。自主性在演示时很好,但到了第二个月往往会被移除。在真实业务中幸存下来的是受限版本:AI看到一切,准备一切,但不会自己做出不可逆的决定。过去几个月有三个例子。一位独立创始人,B2B业务。她想要一个“能直接回复邮件”的代理。但实际需要的是能利用日历和之前对话线程草拟每封回复,然后排队等待一键批准的工具。节省了同样的时间,却不会有未经她批准就向客户承诺退款的风险。她至今每天都在用。一位机构老板。他想要一个“完全自主的日程安排代理”。但他实际需要的是一个能提议不冲突的会议时间并写好邮件的工具——而发送由他负责。我们并没有构建代理,而是省去了他在三个标签页之间切换的麻烦。他每天不再浪费一小时在日程安排的拼图上。一个两人初创团队。他们想要“能管理所有通讯的AI”。但他们实际需要的是会议前的准备工作:在会前把“这是谁”、“我们上次说了什么”、“日历上有什么”集中在一个地方。完全没有自主性。而现在这个功能他们不愿放弃。这些都不是自主代理。但每一个都比创始人最初要求的代理更好,因为那个代理会在第三周自信地发送错误信息,信任就再也回不来了。为什么自主收件箱代理在生产环境中频频失败?邮件是不可逆且充满对抗性的。发出的邮件无法撤销,而一次对客户幻觉般的承诺带来的损失与节省下来的200封邮件的处理时间不成比例。一个好的助理正好有一个人工检查点——发送。而自主代理移除了唯一真正重要的检查点。演示时很美好,但第一次有客户在凌晨2点用奇怪措辞时就是灾难。目前那些悄悄用AI管理收件箱并取得成功的人并没有运行自主代理。他们通过MCP(通常如此)将模型接入真实的邮件和日历,这样AI能看到真实上下文而不是猜测,然后任何离开系统的操作都保留人工参与。像Superhuman的AI、通过MCP连接邮件的Claude、Slashy MCP,甚至原生助手如Slashy、Superhuman、Fyxer等——那些乏味的受限设置才是周二仍然运行的工具。在受监管或面向客户的领域中,完全自主更是双重诅咒。任何严肃的人问的第一个问题是“它能在没有你的情况下发送什么?”回答“未经批准不发送任何内容”会很快让对话对您有利。而回答“它自己决定”则会让对话变成责任审查。如何实际决定?在你付费让人构建自主收件箱代理之前,先在纸上回答这些问题:每个向外操作是否可逆?如果否,你需要的不是自主,而是提议-批准模式。一条错误消息能否让你失去客户或合同?如果是,保持人工发送。到此为止。你真的需要它行动,还是需要它准备?大多数人需要准备——整理上下文、撰写草稿——而不是自主性。是否会有人审计它发送的内容?如果是,你需要一个每项操作都有人工检查点的系统。如果你是一名开发者:在未来一年内,交付诚实的“起草并等待”助手会比追逐“完全自主AI员工”的新闻头条赚更多钱。第一批吃螃蟹的人已经吃了亏,他们正在警告后来者。做个在周四还能够正常运作的人,因为你的工具从未拥有搞砸任何事的权限。运营者、开发者、任何用AI处理真实邮件的人——哪些方案真正有效?哪些搞砸了?真心想听听实战故事。
相似文章
停止构建AI智能体。
作者认为,大多数要求构建AI智能体的创始人实际上只需要简单的自动化流程,并辅以最少的LLM集成,理由包括生产环境故障、合规障碍,以及更简单工作流带来的更高投资回报率。文章提供了一个实用的决策框架,帮助开发者和创始人优先考虑可靠的自动化,而非复杂且不可预测的智能体。
自主智能体被高估,直到业务可读
作者认为,如果没有结构化的业务背景和明确的职责范围,自主AI智能体就被高估了。文章分享了来自客户工作的实际经验,其中智能体按固定节奏运行,并在写入操作时接受人工监督。
AI代理的真正问题在于最后的点击
作者认为,AI代理的真正危险不在于它们的错误,而在于它们能够自主执行最终操作的能力,建议代理应该提前一步停止,将最后的点击留给人类或狭窄的工作流程。
我最近一直在为企业开发 AI Agent,我认为大多数人高估了自主性,却低估了可靠性。
作者认为,在企业级 AI Agent 开发中,运行的可靠性和稳定性比高度自主性更为关键,倡导受控智能而非完全自主的系统。
如何停止构建用户无视的智能体?
关于AI智能体为何难以获得采纳的反思:它们迫使用户切换上下文,产生的摩擦超过了感知价值。作者建议将智能体设计为直接集成到现有工作流程中。