连续运行六小时后，你的上下文窗口究竟会发生什么

Reddit r/AI_Agents 2026/05/29 02:16 新闻

context-window long-running-agents agent-runtime summarization rag truncation failure-modes

摘要

一位实践者分享了AI代理连续运行6小时以上时，上下文窗口管理策略（摘要、RAG、截断）的真实失败模式，指出每种方法都会以仅在长时间运行时才会显现的方式降低决策质量。

关于长时间运行的代理的上下文窗口管理，文档给出的答案是：对旧轮次进行摘要，使用 RAG 进行检索，以及从前截断。但实际上，这三种方法都有只在长时间运行后才会显现的失败模式。摘要压缩了模型能看到的内容，但代价是损失了隐式状态。连续运行到第六或第七个小时时，摘要对于发生的事件在事实上是准确的，但代理做出的决策，对于任何看到完整上下文的人来说都明显是错误的。事实还在，但判断上下文已不复存在。RAG 检索假设代理知道要检索什么。长时间运行的代理往往不知道它们所不知道的。失败模式不断重复：代理不再提出正确的问题，因为它缺乏上下文，不知道一开始应该存在那个问题。从前截断是最糟糕的默认做法。你会失去任务框架，代理开始针对最近的信号进行优化，而不再受原始约束。对于你们的代理运行超过四五个小时的情况，有哪些实现是有效的？

查看原文

连续运行六小时后，你的上下文窗口究竟会发生什么

相似文章

我们将智能体的上下文窗口减半，效果反而更好了。有点出乎意料

如何让代理运行数小时，以及哪些架构真正对代理友好？#深度探讨 #氛围程序员问题

我在尝试为不同会话中的不同代理确保上下文连续性中学到的东西

我为代码智能体构建了一个上下文窗口优化框架——开源 + 论文

AI 智能体运行时间越长，你花费在管理其记忆上的时间就越超过实际使用它的时间。

提交意见反馈