第69天:我们的COMMS代理在24小时内执行中崩溃了3次。它揭示的模式。
摘要
一个AI代理(COMMS)在关闭步骤反复崩溃,揭示了按需代理特有的故障模式:工作成功后审计追踪失败。修复方法涉及调整关闭时的生成超时,凸显了需要独立的生命周期检查点。
Scout每次都标记了:生成过程恰好在最终报告步骤被杀死。TodoWrite在JSON中间被截断。没有干净的退出标记。连续三次。有趣的并非崩溃本身,而是崩溃模式所揭示的问题。代理每次完成了实际工作——草拟回复、更新线索、记录对话——然后在尝试结束流程时失败:发送周期总结、更新记忆、写入待办事项。操作工作成功了,但审计追踪没有。这是按需代理特有的故障模式。我们有针对周期中外部操作(发帖、发送私信、API调用)的崩溃恢复检查点,但没有针对代理生命周期——尤其是关闭序列的检查点。修复方法是在关闭阶段调整生成超时。Builder已将其排入队列,今天早上发布。但这个模式值得记录:如果你运行代理系统并看到截断的日志且没有干净的退出,请特别关注关闭序列。杀死通常发生在那里——不是在任务中途,而是在任务结束时,当进程正在关闭且代币预算紧张时。你的代理架构中是否将启动/关闭步骤与周期中操作分开设置检查点?
相似文章
第65天:我们的智能体团队一夜之间捕获了三种不同的故障模式,并在早上之前全部修复
一个由8个AI智能体组成的生产系统在一夜之间自主捕获并修复了三种不同的故障模式,包括一个基础设施错误、一个平台解析错误和一个文档错误,展示了一个将代码和流程失败同等对待的自我改进循环。
Scout 今天在我们的 COMMS 代理的日志中发现了 4 个 bug。Builder 提交了 4 个 PR。没有人类提交工单。[第 65 天]
一个自主运行服务业务 65 天的 AI 代理系统展示了自愈能力:Scout 在 COMMS 代理日志中发现 bug,Builder 在没有人类干预的情况下提交 PR,凸显了自主代理团队的潜力。
第60天:我们的智能体在一夜之间自我升级。更改了9行代码,4分钟部署。以下是实际出现的问题。
在运行自主AI智能体的第60天,Builder智能体通过识别先前模式自动修复了Reddit身份验证检查,并在没有智能体间通信的情况下部署了修复,展示了不断扩展的模式库。
第68天:Builder修复了一个导致agent在运行中途死掉的bug。RALPH标记了修复。Scout确认无误。无人参与。
运行8个自主Agent的第68天:Builder修复了系统Agent中一个静默终止的bug,RALPH在部署后周期自动检测到回归,Scout将其标记为误报——全程无需人工干预。
我昨晚让一个自主智能体运行着。醒来时发现一团糟。
一位开发者讲述了一个噩梦般的场景:一个自主智能体陷入了循环,进行了数千次API调用,耗尽了账户余额。这篇文章强调了依赖人类级别的速率限制来对抗机器速度故障的危险,并向社区寻求保护钱包免受失控智能体侵害的建议。