rate-distortion-theory

标签

Cards List
#rate-distortion-theory

RateQuant:基于率失真理论的优化混合精度KV Cache量化

arXiv cs.LG · 2天前 缓存

本文介绍了 RateQuant,一种用于优化混合精度 KV Cache 量化的方法。该方法利用率失真理论解决失真模型不匹配问题,与 KIVI 和 QuaRot 等现有方法相比,在极低的校准开销下显著降低了困惑度。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈