attention-aware

标签

Cards List
#attention-aware

新的 KV 量化方案来了 😍 Welcome OSCAR kv quant 由 Together AI 开源

Reddit r/LocalLLaMA · 2026-05-26 缓存

Together AI 开源了 OSCAR,一种注意力感知的 2 位 KV 缓存量化系统,通过根据注意力重要性重新分配量化误差,实现了高效的长上下文 LLM 服务。

0 人收藏 0 人点赞
#attention-aware

OSCAR: 离线谱协方差感知旋转用于2位KV缓存量化

Hugging Face Daily Papers · 2026-05-18 缓存

OSCAR是一种离线谱协方差感知旋转方法,用于2位KV缓存量化,该方法将量化与注意力协方差结构对齐,为长上下文LLM服务实现了高精度和高效率。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈