停止构建自主电子邮件代理

Reddit r/AI_Agents 2026/05/18 13:08 新闻

摘要

作者基于实际失败案例，反对构建完全自主的电子邮件代理，主张采用受限的“提议-批准”工作流，即AI准备上下文和草稿，但由人类最终批准发送。

每周都有一位创始人联系我，想要一个“能管理我收件箱的AI”。而我每周都得劝说他们放弃自主版本，转向一个更乏味但实际有效的方法。我为创始人和小团队构建AI工作流，现在已经做了三十多个。模式如此一致，我甚至能在对话开始前就预判到。他们来的时候都怀着梦想，看过某个演示——某人的“AI行政主管”自动分类、回复、安排会议，在他们睡觉时把收件箱清空到零。他们想要那个效果。然后我们实际花十分钟看看他们的邮件，我得解释为什么他们真正需要的是一个能起草和提议的助手，而他们自己仍然要点击发送。你可以实时看到他们的失望。实际情况是，目前正在交付的大多数“自主收件箱代理”距离搞砸一段客户关系只有一条糟糕回复的距离，而这段关系是主人花了两年时间建立的。自主性在演示时很好，但到了第二个月往往会被移除。在真实业务中幸存下来的是受限版本：AI看到一切，准备一切，但不会自己做出不可逆的决定。过去几个月有三个例子。一位独立创始人，B2B业务。她想要一个“能直接回复邮件”的代理。但实际需要的是能利用日历和之前对话线程草拟每封回复，然后排队等待一键批准的工具。节省了同样的时间，却不会有未经她批准就向客户承诺退款的风险。她至今每天都在用。一位机构老板。他想要一个“完全自主的日程安排代理”。但他实际需要的是一个能提议不冲突的会议时间并写好邮件的工具——而发送由他负责。我们并没有构建代理，而是省去了他在三个标签页之间切换的麻烦。他每天不再浪费一小时在日程安排的拼图上。一个两人初创团队。他们想要“能管理所有通讯的AI”。但他们实际需要的是会议前的准备工作：在会前把“这是谁”、“我们上次说了什么”、“日历上有什么”集中在一个地方。完全没有自主性。而现在这个功能他们不愿放弃。这些都不是自主代理。但每一个都比创始人最初要求的代理更好，因为那个代理会在第三周自信地发送错误信息，信任就再也回不来了。为什么自主收件箱代理在生产环境中频频失败？邮件是不可逆且充满对抗性的。发出的邮件无法撤销，而一次对客户幻觉般的承诺带来的损失与节省下来的200封邮件的处理时间不成比例。一个好的助理正好有一个人工检查点——发送。而自主代理移除了唯一真正重要的检查点。演示时很美好，但第一次有客户在凌晨2点用奇怪措辞时就是灾难。目前那些悄悄用AI管理收件箱并取得成功的人并没有运行自主代理。他们通过MCP（通常如此）将模型接入真实的邮件和日历，这样AI能看到真实上下文而不是猜测，然后任何离开系统的操作都保留人工参与。像Superhuman的AI、通过MCP连接邮件的Claude、Slashy MCP，甚至原生助手如Slashy、Superhuman、Fyxer等——那些乏味的受限设置才是周二仍然运行的工具。在受监管或面向客户的领域中，完全自主更是双重诅咒。任何严肃的人问的第一个问题是“它能在没有你的情况下发送什么？”回答“未经批准不发送任何内容”会很快让对话对您有利。而回答“它自己决定”则会让对话变成责任审查。如何实际决定？在你付费让人构建自主收件箱代理之前，先在纸上回答这些问题：每个向外操作是否可逆？如果否，你需要的不是自主，而是提议-批准模式。一条错误消息能否让你失去客户或合同？如果是，保持人工发送。到此为止。你真的需要它行动，还是需要它准备？大多数人需要准备——整理上下文、撰写草稿——而不是自主性。是否会有人审计它发送的内容？如果是，你需要一个每项操作都有人工检查点的系统。如果你是一名开发者：在未来一年内，交付诚实的“起草并等待”助手会比追逐“完全自主AI员工”的新闻头条赚更多钱。第一批吃螃蟹的人已经吃了亏，他们正在警告后来者。做个在周四还能够正常运作的人，因为你的工具从未拥有搞砸任何事的权限。运营者、开发者、任何用AI处理真实邮件的人——哪些方案真正有效？哪些搞砸了？真心想听听实战故事。

查看原文

停止构建自主电子邮件代理

相似文章

停止构建AI智能体。

自主智能体被高估，直到业务可读

AI代理的真正问题在于最后的点击

我最近一直在为企业开发 AI Agent，我认为大多数人高估了自主性，却低估了可靠性。

如何停止构建用户无视的智能体？

提交意见反馈