标签
Netflix工程师开源了Headroom工具,在本地预处理阶段自动压缩LLM输入上下文,减少高达95%的token消耗,兼容Codex、Cursor等主流AI编码工具,无需修改代码即可生效。
ContextRAG引入了一种无抽取方法,用于构建面向检索增强生成的层次图索引。该方法利用残差量化K均值(Residual-Quantization K-Means)和形式概念分析(Formal Concept Analysis),将大语言模型(LLM)调用和Token数量减少数个数量级,同时在多跳问题上保持具有竞争力的F1分数。