sliding-window

标签

Cards List
#sliding-window

Tensor Cache: 基于驱逐条件的Transformer关联记忆

arXiv cs.LG · 2026-05-25 缓存

Tensor Cache 引入了一种两级缓存机制,将滑动窗口注意力中驱逐的键值对压缩成固定大小的关联记忆,从而在无需无界内存增长的情况下改进长上下文语言建模。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈