context-pruning

标签

Cards List
#context-pruning

更少上下文,更智能代理:面向长周期工具使用的LLM代理的高效上下文工程

arXiv cs.AI · 昨天 缓存

本文评估了企业工具使用工作流中LLM代理的上下文工程配置,表明选择性修剪的摘要化相比全上下文基线实现了91.6%的准确率,同时将令牌使用量减少了60%以上。

0 人收藏 0 人点赞
#context-pruning

通过多准则潜在推理的编码代理上下文剪枝

arXiv cs.AI · 2026-05-18 缓存

LaMR 提出了一种针对编码代理的结构化剪枝框架,将代码相关性分解为语义证据和依赖支持两个维度,使用专用的条件随机场和混合专家门控机制,在保持或提升任务性能的同时,最多可减少 31% 的 Token 使用量。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈