context-pruning

#context-pruning

更少上下文，更智能代理：面向长周期工具使用的LLM代理的高效上下文工程

arXiv cs.AI ↗ · 昨天缓存

本文评估了企业工具使用工作流中LLM代理的上下文工程配置，表明选择性修剪的摘要化相比全上下文基线实现了91.6%的准确率，同时将令牌使用量减少了60%以上。

0 人收藏 0 人点赞

#context-pruning

arXiv cs.AI ↗ · 2026-05-18 缓存

LaMR 提出了一种针对编码代理的结构化剪枝框架，将代码相关性分解为语义证据和依赖支持两个维度，使用专用的条件随机场和混合专家门控机制，在保持或提升任务性能的同时，最多可减少 31% 的 Token 使用量。

0 人收藏 0 人点赞