当你的智能体批准计划后,它实际遵循计划的频率有多高?

Reddit r/AI_Agents 新闻

摘要

一位开发者讨论了AI智能体在多步骤工作流程中偏离已批准计划的常见问题,寻求缩小计划与执行之间差距的建议。

我正在构建多步骤智能体工作流程,却总是遇到同一个障碍。我让智能体编写计划,我审查并批准它,然后在执行过程中它却悄悄做别的事。添加了我没有要求的抽象层,“修复”了范围之外的文件,或者以计划中不同的方式解决问题。我已经开始在步骤之间清除上下文并将任务拆分为更小的部分,这有一定帮助。但“达成一致的计划”与“遵循计划”之间的差距仍然是我最耗时的部分。对于运行真正多步骤设置的人:是什么真正弥合了这一差距?测试或无法跳过的钩子?更小的步骤?某种结构性方法?还是你只能接受必须监控每一步?
查看原文

相似文章