context-compaction

标签

Cards List
#context-compaction

长时段LLM智能体服务的并行上下文压缩

arXiv cs.AI · 2026-05-25 缓存

介绍了用于长时间范围LLM智能体的并行上下文压缩,实现了对摘要量的细粒度控制,并相比多个骨干模型上的顺序同步压缩,降低了端到端延迟。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈