context-compaction

标签

#context-compaction

长时段LLM智能体服务的并行上下文压缩

arXiv cs.AI ↗ · 2026-05-25 缓存

介绍了用于长时间范围LLM智能体的并行上下文压缩，实现了对摘要量的细粒度控制，并相比多个骨干模型上的顺序同步压缩，降低了端到端延迟。

0 人收藏 0 人点赞

← 返回首页

提交意见反馈