@heyshrutimishra: 全尺寸AI模型现在可以在手机上运行。这就是 BitCPM,一个来自 ModelBest、清华大学和 OpenBMB 的全新开源模型。……
摘要
BitCPM 是一个来自 ModelBest、清华大学和 OpenBMB 的新开源模型,它使用三元权重(-1,0,1)在手机上运行全尺寸AI模型。
查看缓存全文
缓存时间: 2026/05/25 08:33
全尺寸AI模型现在可以在手机上运行了。
这就是 BitCPM,一个来自 ModelBest、清华大学和 OpenBMB 的全新开源模型。它的想法几乎简单到极致:每个权重只是 -1、0 或 +1 这三个值之一。
他们称之为 1.58 位(或称三元权重),正是这一点让一个能力如此强的模型小到能塞进手机里。
一个权重如此简单的模型按理说应该明显更差。但 BitCPM 大部分时候并非如此。
与同尺寸的全精度 MiniCPM4 模型相比,它在 1B 到 8B 版本上保持了 93-99% 的质量,在最小的 0.5B 版本上也达到了 90.1%。
重量大约减轻了 6 倍,而能力几乎没受影响。
另一个令人意外的地方是 BitCPM 的出身。
它并非在大多数模型所用的硬件上训练而成。整个过程都运行在华为的昇腾 910B 芯片上,从头到尾,这使得它成为首个在该平台上端到端验证的低位模型。
而且它完全开源。权重和训练脚本都公开,因此任何人都能重建它,而不仅仅是运行它。
如此轻量的模型无需再依赖云端。
它可以在你的手机、笔记本甚至汽车芯片上运行,速度更快、隐私性更强,因为数据无需离开设备。
BitCPM 现已开放,包括完整系列和微调脚本。
Hugging Face: https://huggingface.openbmb.com/collections/openbmb/bitcpm4-cann…
ModelScope: https://modelscope.cn/collections/OpenBMB/BitCPM4-CANN…
如果你从事任何与边缘 AI 相关的开发,务必亲身体验一下,然后向团队反馈你的发现。
相似文章
@rohanpaul_ai:BitCPM-CANN 成为全球首个完全基于中国自主研发AI基础设施训练并开源的1.58位三值LLM
BitCPM-CANN 是首个在完全基于中国自主研发AI基础设施(华为昇腾910B)上训练的开源1.58位三值大语言模型,实现了极致的存储缩减,适用于边缘部署。
@cjzafir: 今天微调你的第一个AI模型。运行GPT4o级别的模型,并在你的手机或笔记本电脑上运行。@OpenBMB发布了15M样本…
OpenBMB发布了UltraData-SFT-2605,一个包含1500万样本的高质量SFT数据集,用于微调如MiniCPM5-1B等AI模型,使其能在手机或笔记本电脑上运行。
@AdinaYakup: MiniCPM V4.6 一个真正能在手机上运行的 1B 多模态大语言模型,由 @OpenBMB 刚刚发布 1B - Apache2.0 支持 iOS、Android,…
OpenBMB 发布了 MiniCPM V4.6,这是一个专为移动设备优化的 1B 参数多模态大语言模型,采用 Apache 2.0 许可证。它具备混合视觉 token 压缩功能,声称在 iOS、Android 和 HarmonyOS 上原生运行时,吞吐量比 Qwen3.5 0.8B 快约 1.5 倍。
@ModelScope2022: MiniCPM5-1B 现已完全开源,包含权重、训练数据和部署代码。1B参数,在Artificial Analysis上排名第一…
MiniCPM5-1B 已完全开源,包含权重、训练数据和部署代码;它在2B以下模型中取得最高评分,并可在边缘设备上运行。
OpenBMB 推出 BitCPM-CANN 1.58 位模型
OpenBMB 推出了 BitCPM-CANN,这是一款在华为 Ascend 910B 硬件上测试的 1.58 位模型。