我为代码智能体构建了一个上下文窗口优化框架——开源 + 论文
摘要
作者介绍了“Apohara Context Forge”,这是一个开源框架及方法论,旨在通过角色感知分割和分层相关性评分来优化代码智能体的上下文窗口。
一直在研究一个我认为这里很多人面临的问题:智能体代码流水线消耗上下文窗口的速度过快,导致重要信息丢失,并在会话中途降低任务质量。Apohara Context Forge 是我解决这一问题的方案。它是一种针对 LLM 智能体结构化上下文组装的方法论及实现——本质上是一个分层相关性评分系统,根据当前任务和智能体角色,决定哪些内容进入上下文窗口以及以何种顺序进入。核心理念:
- 角色感知上下文分割(不同的智能体需要不同形态的上下文)
- 分层优先级评分,优先驱逐低价值 token
- 与原生上下文打包方式进行了基准测试,在长时间会话中的任务完成率有显著提升
- 兼容任何模型(Claude、GPT-4o、Gemini、本地模型)
欢迎提问或讨论设计决策。
相似文章
我是如何解决持续运行的Anthropic智能体循环中上下文窗口膨胀问题的(Opus + Sonnet架构)
一位开发者分享了一种架构模式,用于管理持续运行的Anthropic智能体循环中的上下文窗口膨胀问题,采用KV缓存、动态工具模式加载,以及通过Claude 3.5 Sonnet和Claude 3 Opus解耦执行器与顾问角色。
我构建了一个开源编码代理,让上下文可见且可编辑 — 你可以精确策划大语言模型所看到的内容
作者构建了 Nice Coding Agent,这是一个开源编码工作台,具有可见且可编辑的上下文堆栈,允许用户精确策划大语言模型所看到的内容。它具备本地优先检索、沙盒执行和混合代码搜索功能,旨在让开发者对上下文组装拥有控制和可见性。
更大的上下文窗口似乎在解决与理解不同的问题
Repowise 是一个开源工具,它将代码库索引为五个智能层——依赖图、Git 历史、自动生成的文档、架构决策和代码健康——并通过 MCP 工具将这些信息暴露给 AI 编码代理,以提供更准确的上下文并减少工具调用次数。
AI智能体的有效上下文工程
Anthropic发布指南,将上下文工程定义为提示工程的演进,侧重于为AI智能体筛选最优上下文token,以在多轮推理过程中保持性能和专注度。
@Saboo_Shubham_: 这实际上是针对AI编程助手的上下文工程。它可以将任何代码库转化为交互式图表,供你的助手查询……
此工具为AI编程助手提供上下文工程,通过将任何代码库转换为可查询的交互式图表,兼容Claude Code、Codex和Antigravity,并且100%开源。