bit-width

#bit-width

LiftQuant: Continuous Bit-Width LLM via Dimensional Lifting and Projection

arXiv cs.LG ↗ · 2026-06-04 Cached

LiftQuant introduces a 'lift-then-project' mechanism enabling continuous (non-integer) bit-width quantization for LLMs, allowing precise fitting to hardware memory budgets. The framework compresses a 70B LLM to 2.4-bit to fit a 24GB GPU, outperforming state-of-the-art 2-bit models.

0 favorites 0 likes

bit-width

LiftQuant: Continuous Bit-Width LLM via Dimensional Lifting and Projection

Submit Feedback