让LLM上下文组装变得可编程

Reddit r/AI_Agents 2026/06/10 14:21 工具

摘要

RAMPART是一个Python库，它使LLM上下文组装变得可编程，允许开发者注册命名的上下文块，并将其放置在模型第一个token之前。通过块聚类和工具访问控制，它在多种模型上将性能提升了数十个百分点。

如今大多数智能体框架都将系统提示视为启动时读取的静态文件。技能、工具和规则被拼接成一个块，在整个会话中保持不变，尽管我们从'Lost in the Middle'的研究中得知，指令在上下文中的位置与其内容同样重要。那么，为什么不让上下文组装本身成为一个显式、可编程的步骤呢？这正是RAMPART所做的。它是一个Python库，将提示构建步骤转化为一个注册命名块的体系，在模型的第一个token之前以零提示token成本运行。现有的SKILL.md和CLAUDE.md文件无需修改即可导入。部署完全在RAM中进行，无需数据库，延迟上限为一次方法调用。编译时放置以及块与任务查询之间的结构关系都会影响任务成功率；将关键块与内容相邻的块分组，能在单块放置失败的情况下将性能提升数十个百分点。这一模式在来自三个实验室的五种模型上得到了复现。在最难的注册规模下，块聚类使Mistral-7B的平均通过率提高了大约五倍，并且在中等注册规模区域，经过干预的较小模型表现优于未干预的较大模型。通过模式驱逐实现工具访问控制在这里非常明显，模型从未看到被移除的内容，无需策略指令。此外，还涌现出一些有趣的可能性，即在多个智能体之间进行零token协调。

查看原文

让LLM上下文组装变得可编程

相似文章

RAMPART：基于注册表的智能体记忆系统，具备优先级感知的运行时转换能力

仅靠基准测试不够：RAMP——生产系统中代理模型的运行时评估

@samhogan：顺便提一句，RLM 基本已解决上下文问题。你只需将上千万个 token 投入一个成熟的 RLM 框架中，它就能直接跑通……

@MaximeRivest: 当前的LLM架构很蠢（如果不算蠢，至少也是浪费）。以下三个包含4个上下文块的提示词：…

我构建了一个开源编码代理，让上下文可见且可编辑 — 你可以精确策划大语言模型所看到的内容

提交意见反馈