互联网资讯 / 人工智能 · 2026年5月26日

首个基于华为昇腾训练的1.58-bit端侧大模型BitCPM-CANN发布

【TechWeb】5月25日,面壁智能联合清华大学及OpenBM正式发布并开源其全新的1.58-bit端侧大模型——BitCPM-CANN。这是中国首个完全基于华为昇腾平台实现端到端训练的三值大模型。

面壁智能等开源首个基于华为昇腾训练的1.58-bit 端侧大模型BitCPM-CANN

此次发布标志着自5月23日在华为鲲鹏昇腾开发者大会(KADC 2026)首次亮相后,BitCPM-CANN全系列模型正式向社会开放。

根据介绍,与传统的BF16精度相比,BitCPM-CANN在推理阶段可实现约6倍的存储红利,同时模型的能力保留率可维持在90%至97.2%。在同样的设备下,用户可以运行更大规模的模型,或者在同一款终端上运行相同的模型时,仅需过去1/6的存储。这意味着未来有望在手机上运行60B的大模型,显著提升智能手机的智能化水平。

“2-bit”是过去一年中端侧芯片行业的热门研究话题,成为在手机上运行更大参数模型的关键技术瓶颈。2-bit量化技术可将模型权重压缩6到8倍,使其能够存入手机闪存。例如,在4GB的存储中可容纳16B的模型,结合MoE与激活范围约束可扩展至32B;若内存扩大到8GB,则模型参数可增至60B。

面壁智能表示,BitCPM-CANN的推出不仅标志着其在端侧大模型领域的能力提升,也通过开源为中国端侧大模型的发展贡献了新的力量。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.