标签
这是一个讨论帖,征求关于如何处理能够执行实际操作的AI代理的权限和授权(包括审计追踪和权限范围)的意见。
本文介绍了一种自主代理的运行时执行模型,该模型强制执行'重构性权威'——仅当从当前状态能构建出权威时,才允许执行动作。该模型包括动态依赖解析、针对不确定性的暂停状态以及集成漂移检测的恢复循环。
本文认为,AI安全辩论的方向有误,其关注点在于模型对齐和内部控制,而非关键的边界:对智能体执行的外部授权权限。文章警告称,能够自行授权高影响行动(如部署代码、转移资金)的系统构成了基本风险,日志记录和监控无法缓解这种风险。