OpenBMB 推出 BitCPM-CANN 1.58 位模型
摘要
OpenBMB 推出了 BitCPM-CANN,这是一款在华为 Ascend 910B 硬件上测试的 1.58 位模型。
正在华为 Ascend 910B 上测试新模型。链接:https://x.com/i/status/2057816337880355220
相似文章
新的BITNET模型!
OpenBMB发布的新BitCPM4-CANN模型(1B、3B、8B),已上架Hugging Face;等待llamacpp支持以进行测试。
@AdinaYakup: BitCPM4-CANN 原生1.58位LLM训练系统,在昇腾NPU上运行 https://huggingface.co/collections/openbmb/bitcpm4-cann…
OpenBMB 发布了 BitCPM4-CANN,这是一套原生训练的三元量化1.58位LLM集合(参数规模0.5B到8B),通过CANN针对昇腾NPU进行了优化,推理时内存减少6倍,训练开销极低。
@rohanpaul_ai:BitCPM-CANN 成为全球首个完全基于中国自主研发AI基础设施训练并开源的1.58位三值LLM
BitCPM-CANN 是首个在完全基于中国自主研发AI基础设施(华为昇腾910B)上训练的开源1.58位三值大语言模型,实现了极致的存储缩减,适用于边缘部署。
@AdinaYakup: MiniCPM V4.6 一个真正能在手机上运行的 1B 多模态大语言模型,由 @OpenBMB 刚刚发布 1B - Apache2.0 支持 iOS、Android,…
OpenBMB 发布了 MiniCPM V4.6,这是一个专为移动设备优化的 1B 参数多模态大语言模型,采用 Apache 2.0 许可证。它具备混合视觉 token 压缩功能,声称在 iOS、Android 和 HarmonyOS 上原生运行时,吞吐量比 Qwen3.5 0.8B 快约 1.5 倍。
@heyshrutimishra: 全尺寸AI模型现在可以在手机上运行。这就是 BitCPM,一个来自 ModelBest、清华大学和 OpenBMB 的全新开源模型。……
BitCPM 是一个来自 ModelBest、清华大学和 OpenBMB 的新开源模型,它使用三元权重(-1,0,1)在手机上运行全尺寸AI模型。