bit-width

#bit-width

# LiftQuant：基于维度提升与投影的连续比特宽度大语言模型量化

arXiv cs.LG ↗ · 2026-06-04 缓存

# LiftQuant 引入"先提升后投影"机制，实现大语言模型的连续（非整数）位宽量化，精准适配硬件内存预算。该框架将 70B 大语言模型压缩至 2.4 位以适配 24GB GPU，性能超越当前最先进的 2 位模型。

0 人收藏 0 人点赞