ternary-quantization

标签

Cards List
#ternary-quantization

@AdinaYakup: BitCPM4-CANN 原生1.58位LLM训练系统,在昇腾NPU上运行 https://huggingface.co/collections/openbmb/bitcpm4-cann…

X AI KOLs Following · 2026-05-22 缓存

OpenBMB 发布了 BitCPM4-CANN,这是一套原生训练的三元量化1.58位LLM集合(参数规模0.5B到8B),通过CANN针对昇腾NPU进行了优化,推理时内存减少6倍,训练开销极低。

0 人收藏 0 人点赞
#ternary-quantization

Tequila:一种面向大语言模型的无陷阱三元量化方法

Papers with Code Trending · 2025-09-28 缓存

本文介绍了Tequila,这是一种针对大语言模型的无陷阱量化方法,通过将陷入死区的权重重新利用为动态偏置,提高了三元量化的准确性和推理速度。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈