更大的上下文窗口对智能体来说其实是错误的方向吗?
摘要
作者质疑将注意力集中在扩大AI智能体的上下文窗口上是否适得其反,认为积累的垃圾信息会拖慢长时间会话,并建议保持工作上下文小巧、使用外部记忆。
我构建编码智能体已有数月,但总有一个奇怪的想法挥之不去:我们是不是在智能体记忆问题上找错了方向?大量精力似乎都花在扩大上下文窗口上——更多历史记录、更多摘要、更多重放、提示中塞入更多内容。诚然,更大的上下文很有用。但我参与过的每个长期运行智能体,最终都开始拖累垃圾信息:旧的调试尝试、几小时前就被放弃的计划、不再成立的假设、无关紧要的闲聊。到某个节点,这更像是杂乱而非记忆。因此近来我怀疑,更好的方法几乎恰恰相反:保持工作上下文精简,将记忆存储在其他地方,仅按需拉取智能体当前真正需要的内容。本质上就是把模型当作无状态来对待——因为它本就是如此。也许我忽略了某些显而易见的东西,但直觉告诉我,长时间会话的失败更多源于积累的垃圾,而非缺乏上下文。对于那些运行智能体成百上千次迭代的人而言,你们觉得这个思路会在哪里失效?最先出问题的是什么?
相似文章
我认为长上下文代理的失败方式非常无聊
一篇观点文章,认为长上下文窗口并不等同于记忆,代理失败通常很普通,比如忘记约束或重新读取文件,强调可靠性取决于上下文架构决策。
连续运行六小时后,你的上下文窗口究竟会发生什么
一位实践者分享了AI代理连续运行6小时以上时,上下文窗口管理策略(摘要、RAG、截断)的真实失败模式,指出每种方法都会以仅在长时间运行时才会显现的方式降低决策质量。
@lateinteraction: 智能体通常将部分上下文外部化:在编码智能体中的仓库,在RAG中的语料库,以及在RLM中的用户提示。N…
Joshua Gu的新研究表明,AI智能体在管理其上下文窗口中的一个小缓冲区作为外部上下文的缓存时表现更好,这挑战了将上下文完全推出提示符的常见做法。
不要轻信大上下文窗口
分析表明,LLM 声称的大上下文窗口具有误导性,因为有效注意力在约 10 万 token 时会下降。为开发者提供实用建议:通过使用工件(artifacts)和切换(handoffs)将会话保持在“智能区”。
更大的上下文窗口并未解决企业记忆问题——原因如下
本文批评了LLM中不断扩大上下文窗口的趋势,认为由于检索退化、数据量和缺乏结构,这并不能解决企业知识问题。文章主张在检索之前建立知识建模层,以映射关系和意图。