memory-modeling

标签

Cards List
#memory-modeling

动态线性注意力

arXiv cs.CL · 6天前 缓存

本文提出DLA,一种用于多状态线性注意力的动态内存建模框架,它能根据令牌信息变化自适应地合并状态,并维护固定大小的状态缓存,从而在无需标准注意力二次复杂度的前提下实现更好的长上下文表示。

0 人收藏 0 人点赞
#memory-modeling

Dynamic Linear Attention

Hugging Face Daily Papers · 2026-06-09 缓存

DLA引入了自适应状态合并和容量受限的内存建模,用于多状态线性注意力,提升了长上下文LLM的性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈