更智能的AI代理并不意味着更好的AI代理
摘要
文章认为,提高AI代理的能力并不会自然而然地提升其可靠性,强调需要建立类似会计标准的稳健控制系统、审计和人类监督,以防止令人信服的失败。
我不理解为什么人们认为让模型变得更智能、更强大就能解决一切问题。我认为他们混淆了AI代理的两种不同能力:1. 能力 2. 可靠性。让代理更智能可以提升其能力。它能够更好地规划、编写更优质的代码、使用更多工具、从更多错误中恢复,并在更广泛的上下文中运作。但这并不会自动使整个工作流程更可靠。有时甚至可能让失败模式变得更糟。一个弱的代理会明显失败。一个更强的代理则可能以一种令人信服的方式失败。它能产出一份看似精良的结果,通过狭隘的检查,很好地解释自己,但仍然以难以察觉的方式出错。这正是我认为在许多代理讨论中被忽略的部分。其隐含的假设似乎是:一旦模型足够智能,可靠性问题便会基本消失。我不认为这是必然的。在会计工作中,你不会仅仅因为做账的人聪明就信任其流程。聪明的人仍然需要控制措施。你仍然需要职责分离。你仍然需要核对账目。你仍然保留审计轨迹。你仍然需要审批和异常处理。这并非因为人人恶意,而是因为人人都可能犯错。这就是为什么我一直觉得常见的AI代理论述有些奇怪。我做了20年的会计师,所以也许我的默认视角不同。对我来说,显而易见的问题不是“这个行为者有多聪明?”,而是“这个行为者周围存在哪些控制措施?”代理的能力越强,其周边的控制系统就越重要:
- 清晰的职责范围
- 允许操作的文件
- 受保护的文件
- 验收标准
- 不变性条件
- 证据日志
- 默认关闭的检查
- 异常情况的人工审批
这些都不意味着代理毫无用处。而是说代理足够强大,其工作需要有结构化的约束。缺乏控制措施的信任不过是空想。对我来说,问题不仅仅在于“代理能变得多聪明?”,而是:
> 什么样的控制系统能让这种能力变得值得信赖?
是我过度思考了,还是说更强大的代理能力实际上让控制措施变得更重要,而非更不重要?
相似文章
AI代理没有智能问题,它们有状态管理问题
文章认为,AI代理在生产中的大多数故障是由于不稳定的运行状态和内存退化造成的,而非模型能力不足,并强调需要更好的基础设施来支持状态管理、可观测性和自适应可靠性。
目前 AI 智能体最大的谎言在于:更高的自主性自动意味着更高的价值
文章认为,AI 智能体的高自主性会增加错误发生的成本,因此主张采用受约束的、可靠的智能体,将安全性和可预测性置于无限制的能力之上。
AI代理不仅仅需要更多的自主性,更需要关于何时停止的更好判断。
本文认为,AI代理需要更好的判断力来决定何时避免行动,特别是在数据不完整或结果不可逆的情况下。同时,受控的自主性对公司来说更值得信赖。
AI代理最诡异的一点:人类失败模式开始显现
作者观察到AI代理展现出类似人类的失败模式,比如在上下文压力下过度自信和跳过步骤,这表明系统可靠性更多地依赖于稳健的验证和受控环境,而不仅仅是模型智能。
我最近一直在为企业开发 AI Agent,我认为大多数人高估了自主性,却低估了可靠性。
作者认为,在企业级 AI Agent 开发中,运行的可靠性和稳定性比高度自主性更为关键,倡导受控智能而非完全自主的系统。