11:52IT之家(博客/媒体)精选76°面壁智能联合清华大学、OpenBMB开源社区发布BitCPM-CANN,这是中国首个完全基于华为昇腾算力平台实现端到端训练并开源的三值(1.58-bit)大模型。该模型包含0.5B、1B、3B、8B四个尺寸,在推理阶段相比传统BF16精度释放约6倍显存红利,模型能力保留率维持在90%-97.2%。这意味着8B参数模型可轻松运行在当前主流旗舰手机上。面壁智能还基于MindSpeed×Megatron-LM搭建了完整的低比特训练底座,为后续昇腾上的低比特训练提供公共基础设施。全系列模型权重已在HuggingFace和ModelScope开源。AI模型端侧大模型低比特量化华为昇腾开源/仓库面壁智能推荐理由:国产算力终于跑通端侧大模型全链路——6倍显存红利让8B模型直接上手机,做端侧AI部署或国产芯片适配的团队值得一试。原文