连续运行六小时后,你的上下文窗口究竟会发生什么

Reddit r/AI_Agents 新闻

摘要

一位实践者分享了AI代理连续运行6小时以上时,上下文窗口管理策略(摘要、RAG、截断)的真实失败模式,指出每种方法都会以仅在长时间运行时才会显现的方式降低决策质量。

关于长时间运行的代理的上下文窗口管理,文档给出的答案是:对旧轮次进行摘要,使用 RAG 进行检索,以及从前截断。但实际上,这三种方法都有只在长时间运行后才会显现的失败模式。摘要压缩了模型能看到的内容,但代价是损失了隐式状态。连续运行到第六或第七个小时时,摘要对于发生的事件在事实上是准确的,但代理做出的决策,对于任何看到完整上下文的人来说都明显是错误的。事实还在,但判断上下文已不复存在。RAG 检索假设代理知道要检索什么。长时间运行的代理往往不知道它们所不知道的。失败模式不断重复:代理不再提出正确的问题,因为它缺乏上下文,不知道一开始应该存在那个问题。从前截断是最糟糕的默认做法。你会失去任务框架,代理开始针对最近的信号进行优化,而不再受原始约束。对于你们的代理运行超过四五个小时的情况,有哪些实现是有效的?
查看原文

相似文章