soft-token-adapters

标签

Cards List
#soft-token-adapters

KV Packet: 免重计算的上下文无关KV缓存用于大语言模型

Hugging Face Daily Papers · 2026-04-14 缓存

KV Packet 提出了一种免重计算的缓存复用框架,用于大语言模型。该框架使用可训练的软标记适配器来弥合上下文不连续性,消除了开销,同时在 Llama-3.1 和 Qwen2.5 上的性能与完全重计算基线相当。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈