我认为很多人低估了不可靠 Agent 的成本有多高

Reddit r/AI_Agents 2026/05/11 14:33 新闻

ai-agents reliability automation cognitive-overhead web-automation trust-in-ai

摘要

作者指出，不可靠 AI Agent 的隐性成本在于持续人工监控所带来的认知开销，并强调在实际落地中，可预测性与环境稳定性远比模型的原始智能更重要。当 Agent 运行在受控且经过验证的环境中，而非充满不确定性的环境时，实际工作流的效率将得到显著提升。

成本不在于 API 费用，而在于人类的注意力。我最近有一个工作流，从技术上讲它“能跑”：能完成任务、返回输出、也没有崩溃。但每隔几个小时，我还是会手动检查一遍，因为我没有完全信任它。最终我意识到：如果我要持续监控系统，那我大脑的一部分就仍在替它干活。这种隐性的认知开销累积得非常快。我认为这就是为什么很多 Agent 的演示看起来令人惊叹，却无法在日常实际使用中存活下来。可靠性不仅仅关乎准确率，更关乎人类是否能放心地长时间不去管它。真正对我产生实用价值的 Agent 并不是最聪明的那些，而是具备以下特点的： * 行为可预测 * 边界严格 * 执行前经过验证 * 输入稳定说实话，我的很多“AI 问题”最终其实都是环境问题。尤其是在基于 Web 的任务中：页面加载不稳定、数据不一致、会话过期。Agent 往往会对它看到的任何异常状况做出糟糕的应对。一旦我让这一层变得更稳定——通过采用更受控的浏览器配置，并尝试 Browser Use 和 hyperbrowser 等工具——同样的工作流突然变得可靠多了，而我甚至没怎么更换模型。很好奇其他人是否也有同感：Agent 到底要达到什么程度的可信度，我们才能彻底停止不断的检查？

查看原文

我认为很多人低估了不可靠 Agent 的成本有多高

相似文章

我最近一直在为企业开发 AI Agent，我认为大多数人高估了自主性，却低估了可靠性。

AI代理最诡异的一点：人类失败模式开始显现

目前 AI 智能体最大的谎言在于：更高的自主性自动意味着更高的价值

有没有人也觉得AI代理在事情变得复杂之前都表现得很惊艳？

关于 AI 智能体的真实内情

提交意见反馈