AI-NEWS · 2026年 5月 26日

中国首个 1.58 位大模型来了

名硕智能联手清华,搞定了个“三进制”大模型

最近有个挺有意思的动作:名硕智能联合清华大学和开源社区,把中国第一个基于华为昇腾平台训练的大模型——BitCPM-CANN 给开源了。

这模型有点特别,它用的是三进制,也就是 1.58-bit 的精度。说实话,看到“低比特大模型”这几个字时,我心里是咯噔了一下,毕竟以前大家总觉得精度低效果就得大打折扣。但这次的数据确实让人眼前一亮:

  • 省显存:跟同尺寸的全精度 MiniCPM4 比,它推理时能省出大概 6 倍的显存。
  • 规格全:0.5B、1B、3B、8B 四个版本都有。
  • 能跑手机:最让我意外的是,那个 8B 参数的模型,居然能在现在的旗舰手机上流畅跑起来。这意味着大模型不再是大厂服务器的专属玩具了。
  • 序列长:底层支持 32K 长序列处理,这点对于处理长文档或长视频挺实用的。

技术这块儿,他们是从头到尾自己搭的链路。从量化算子到训练算法,完全没依赖国外的底层框架。听起来挺顺耳的,毕竟“卡脖子”的事儿总得有人先啃下来。他们基于 MindSpeed 和 Megatron-LM 搭了个低比特训练的基础设施,环境适配、并行策略、集成算子,该有的都有。

代码已经全量开源了,去 HuggingFace 或 ModelScope 就能拉取。对于想尝试昇腾平台的开发者来说,这算是个现成的梯子,省去了不少造轮子的麻烦。

至于这背后的意义,我倒是没想得太高远。它确实证明了国产算力(华为昇腾)现在能干活了,而且干得还不错。但这更多是技术自主可控的一个节点,至于未来能不能真正落地到各种智能应用里,还得看后续的实际效果。毕竟,从实验室数据到大规模商用,中间的坑还不少呢。

火龙果频道