bit-width

标签

Cards List
#bit-width

# LiftQuant:基于维度提升与投影的连续比特宽度大语言模型量化

arXiv cs.LG · 2026-06-04 缓存

# LiftQuant 引入"先提升后投影"机制,实现大语言模型的连续(非整数)位宽量化,精准适配硬件内存预算。该框架将 70B 大语言模型压缩至 2.4 位以适配 24GB GPU,性能超越当前最先进的 2 位模型。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈