【TechWeb】5月25日,面壁智能联合清华大学及OpenBM正式发布并开源其全新的1.58-bit端侧大模型——BitCPM-CANN。这是中国首个完全基于华为昇腾平台实现端到端训练的三值大模型。
此次发布标志着自5月23日在华为鲲鹏昇腾开发者大会(KADC 2026)首次亮相后,BitCPM-CANN全系列模型正式向社会开放。
根据介绍,与传统的BF16精度相比,BitCPM-CANN在推理阶段可实现约6倍的存储红利,同时模型的能力保留率可维持在90%至97.2%。在同样的设备下,用户可以运行更大规模的模型,或者在同一款终端上运行相同的模型时,仅需过去1/6的存储。这意味着未来有望在手机上运行60B的大模型,显著提升智能手机的智能化水平。
“2-bit”是过去一年中端侧芯片行业的热门研究话题,成为在手机上运行更大参数模型的关键技术瓶颈。2-bit量化技术可将模型权重压缩6到8倍,使其能够存入手机闪存。例如,在4GB的存储中可容纳16B的模型,结合MoE与激活范围约束可扩展至32B;若内存扩大到8GB,则模型参数可增至60B。
面壁智能表示,BitCPM-CANN的推出不仅标志着其在端侧大模型领域的能力提升,也通过开源为中国端侧大模型的发展贡献了新的力量。
