AI-NEWS · 2026年 5月 26日

中国首个 1.58 位大模型来了

名硕智能联手清华，搞定了个“三进制”大模型

最近有个挺有意思的动作：名硕智能联合清华大学和开源社区，把中国第一个基于华为昇腾平台训练的大模型——BitCPM-CANN 给开源了。

这模型有点特别，它用的是三进制，也就是 1.58-bit 的精度。说实话，看到“低比特大模型”这几个字时，我心里是咯噔了一下，毕竟以前大家总觉得精度低效果就得大打折扣。但这次的数据确实让人眼前一亮：

省显存：跟同尺寸的全精度 MiniCPM4 比，它推理时能省出大概 6 倍的显存。
规格全：0.5B、1B、3B、8B 四个版本都有。
能跑手机：最让我意外的是，那个 8B 参数的模型，居然能在现在的旗舰手机上流畅跑起来。这意味着大模型不再是大厂服务器的专属玩具了。
序列长：底层支持 32K 长序列处理，这点对于处理长文档或长视频挺实用的。

技术这块儿，他们是从头到尾自己搭的链路。从量化算子到训练算法，完全没依赖国外的底层框架。听起来挺顺耳的，毕竟“卡脖子”的事儿总得有人先啃下来。他们基于 MindSpeed 和 Megatron-LM 搭了个低比特训练的基础设施，环境适配、并行策略、集成算子，该有的都有。

代码已经全量开源了，去 HuggingFace 或 ModelScope 就能拉取。对于想尝试昇腾平台的开发者来说，这算是个现成的梯子，省去了不少造轮子的麻烦。

至于这背后的意义，我倒是没想得太高远。它确实证明了国产算力（华为昇腾）现在能干活了，而且干得还不错。但这更多是技术自主可控的一个节点，至于未来能不能真正落地到各种智能应用里，还得看后续的实际效果。毕竟，从实验室数据到大规模商用，中间的坑还不少呢。

火龙果频道

您可能还喜欢...