@rohanpaul_ai:BitCPM-CANN 成为全球首个完全基于中国自主研发AI基础设施训练并开源的1.58位三值LLM
摘要
BitCPM-CANN 是首个在完全基于中国自主研发AI基础设施(华为昇腾910B)上训练的开源1.58位三值大语言模型,实现了极致的存储缩减,适用于边缘部署。
查看缓存全文
缓存时间: 2026/05/24 04:16
BitCPM-CANN 刚刚成为全球首个完全基于中国自主研发的 AI 基础设施训练、并开源的 1.58 位三元大语言模型。
该模型由 ModelBest、清华大学和 OpenBMB 社区联合开发,其整个训练流程——从量化算子与算法到全栈框架——均原生运行于华为昇腾 910B NPU 上。
1.58 位三元权重仅使用三种权重状态,因此模型在手机、PC、汽车以及本地工业设备上部署时,所需内存大幅减少。
更难的是其背后的训练系统:QAT、STE、低位算子、算法、框架工作以及可复现的训练脚本,所有这些都必须在昇腾 910B 上协调一致地运行。
当硬件成本上升时,胜出的模型不仅仅是榜单上分数更高的那个,而是能在现实约束下被训练、复现、部署和优化的那个。
OpenBMB (@OpenBMB): 🚀 BitCPM-CANN 由 ModelBest × @Tsinghua_Uni × OpenBMB 联手打造——它无关参数堆叠。 内存成本飞涨,硬件限制日益收紧。边缘AI需要更智能的解决方案——而BitCPM-CANN做到了!🎉
✅ 面向边缘就绪:8B模型流畅运行于
相似文章
@AdinaYakup: BitCPM4-CANN 原生1.58位LLM训练系统,在昇腾NPU上运行 https://huggingface.co/collections/openbmb/bitcpm4-cann…
OpenBMB 发布了 BitCPM4-CANN,这是一套原生训练的三元量化1.58位LLM集合(参数规模0.5B到8B),通过CANN针对昇腾NPU进行了优化,推理时内存减少6倍,训练开销极低。
@heyshrutimishra: 全尺寸AI模型现在可以在手机上运行。这就是 BitCPM,一个来自 ModelBest、清华大学和 OpenBMB 的全新开源模型。……
BitCPM 是一个来自 ModelBest、清华大学和 OpenBMB 的新开源模型,它使用三元权重(-1,0,1)在手机上运行全尺寸AI模型。
OpenBMB 推出 BitCPM-CANN 1.58 位模型
OpenBMB 推出了 BitCPM-CANN,这是一款在华为 Ascend 910B 硬件上测试的 1.58 位模型。
Ternary Bonsai:1.58 比特下的顶级智能
一种使用三值权重(-1、0、1)的高效 AI 模型架构,仅需 1.58 比特/参数即可实现具有竞争力的性能,可部署在极度受限的设备上。
@AdinaYakup: MiniCPM5-1B 是 1B 参数级别中的一款令人印象深刻的发布!@OpenBMB https://huggingface.co/collections/openbmb/minicpm5… 1B …
MiniCPM5-1B 是 OpenBMB 推出的全新 1B 参数 AI 模型,具有 Think/No-Think 模式的混合推理能力、128K 上下文窗口、Apache 2.0 许可证,并可在多种硬件上运行。