@AdinaYakup: BitCPM4-CANN 原生1.58位LLM训练系统,在昇腾NPU上运行 https://huggingface.co/collections/openbmb/bitcpm4-cann…
摘要
OpenBMB 发布了 BitCPM4-CANN,这是一套原生训练的三元量化1.58位LLM集合(参数规模0.5B到8B),通过CANN针对昇腾NPU进行了优化,推理时内存减少6倍,训练开销极低。
查看缓存全文
缓存时间: 2026/05/23 12:05
BitCPM4-CANN 在昇腾NPU上的原生1.58比特LLM训练系统 https://huggingface.co/collections/openbmb/bitcpm4-cann… 0.5B/1B/3B/8B - Apache 2.0 推理时内存减少6倍 训练吞吐开销仅4.5%
BitCPM4-CANN - 一个openbmb系列
来源:https://huggingface.co/collections/openbmb/bitcpm4-cann 约23小时前更新
基于CANN的全流水线三元量化模型。
- — #### openbmb/BitCPM4-CANN-0.5B-gguf 文本生成 • 0.4B • 1天前更新 • 185 • 2 (https://huggingface.co/openbmb/BitCPM4-CANN-0.5B-gguf)
- — #### openbmb/BitCPM4-CANN-1B-gguf 文本生成 • 2B • 1天前更新 • 174 • 1 (https://huggingface.co/openbmb/BitCPM4-CANN-1B-gguf)
- — #### openbmb/BitCPM4-CANN-3B-gguf 文本生成 • 4B • 1天前更新 • 162 • 2 (https://huggingface.co/openbmb/BitCPM4-CANN-3B-gguf)
- — #### openbmb/BitCPM4-CANN-8B-gguf 文本生成 • 8B • 1天前更新 • 256 • 7 (https://huggingface.co/openbmb/BitCPM4-CANN-8B-gguf)
- — #### openbmb/BitCPM4-CANN-0.5B 文本生成 • 1天前更新 • 176 • 5 (https://huggingface.co/openbmb/BitCPM4-CANN-0.5B)
- — #### openbmb/BitCPM4-CANN-1B 文本生成 • 1天前更新 • 58 • 5 (https://huggingface.co/openbmb/BitCPM4-CANN-1B)
- — #### openbmb/BitCPM4-CANN-3B 文本生成 • 1天前更新 • 82 • 6 (https://huggingface.co/openbmb/BitCPM4-CANN-3B)
- — #### openbmb/BitCPM4-CANN-8B 文本生成 • 1天前更新 • 204 • 12 (https://huggingface.co/openbmb/BitCPM4-CANN-8B)
- — #### openbmb/BitCPM4-CANN-0.5B-unquantized 文本生成 • 约21小时前更新 • 50 (https://huggingface.co/openbmb/BitCPM4-CANN-0.5B-unquantized)
- — #### openbmb/BitCPM4-CANN-1B-unquantized 文本生成 • 约21小时前更新 • 71 (https://huggingface.co/openbmb/BitCPM4-CANN-1B-unquantized)
- — #### openbmb/BitCPM4-CANN-3B-unquantized 文本生成 • 约21小时前更新 • 64 (https://huggingface.co/openbmb/BitCPM4-CANN-3B-unquantized)
- — #### openbmb/BitCPM4-CANN-8B-unquantized 文本生成 • 约21小时前更新 • 72 (https://huggingface.co/openbmb/BitCPM4-CANN-8B-unquantized)
相似文章
@rohanpaul_ai:BitCPM-CANN 成为全球首个完全基于中国自主研发AI基础设施训练并开源的1.58位三值LLM
BitCPM-CANN 是首个在完全基于中国自主研发AI基础设施(华为昇腾910B)上训练的开源1.58位三值大语言模型,实现了极致的存储缩减,适用于边缘部署。
新的BITNET模型!
OpenBMB发布的新BitCPM4-CANN模型(1B、3B、8B),已上架Hugging Face;等待llamacpp支持以进行测试。
OpenBMB 推出 BitCPM-CANN 1.58 位模型
OpenBMB 推出了 BitCPM-CANN,这是一款在华为 Ascend 910B 硬件上测试的 1.58 位模型。
@AdinaYakup: MiniCPM V4.6 一个真正能在手机上运行的 1B 多模态大语言模型,由 @OpenBMB 刚刚发布 1B - Apache2.0 支持 iOS、Android,…
OpenBMB 发布了 MiniCPM V4.6,这是一个专为移动设备优化的 1B 参数多模态大语言模型,采用 Apache 2.0 许可证。它具备混合视觉 token 压缩功能,声称在 iOS、Android 和 HarmonyOS 上原生运行时,吞吐量比 Qwen3.5 0.8B 快约 1.5 倍。
@FeitengLi: OpenBMB 开源 MiniCPM-V 4.6 了,1.3B 参数(SigLIP2-400M + Qwen3.5-0.8B),262k 上下文,视觉编码 FLOPs 比上一代少 50%+。 同任务 token 成本比 Qwen3.5-0…
OpenBMB releases MiniCPM-V 4.6, a 1.3B-parameter multimodal LLM with 262k context and significantly reduced visual encoding FLOPs, achieving strong benchmark performance and broad inference framework support.