№bitcpmcann·general
BitCPM-CANN
别名
- 首次出现
- 2026-05-22
- 最近出现
- 2026-05-26
- 累计提及
- 13
§ 01综述
大模型训练和部署对算力的需求持续攀升,业界探索低比特量化等技术以降低成本并适配国产硬件。近期,面壁智能与清华大学联合开源了 BitCPM-CANN,这是一个基于华为昇腾 CANN 计算架构的 1.58-bit 三元大模型训练框架,实现在国产计算设备上的极低比特训练。
面壁智能联合清华开源首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN(IT之家)。该模型参数以三元(-1, 0, +1)表示,大幅降低内存占用和计算开销,可在昇腾芯片上高效训练。
模型基于全中文基础设施(包括数据、训练框架)进行训练,是首个支持国产芯片完成 1.58-bit 模型训练的公开方案(X 平台 rohanpaul_ai)。
该开源项目由面壁智能与 Bingbi AI 等机构推动,旨在探索在国产算力环境下实现极致低比特量化的可能性,降低大模型对高端 GPU 的依赖(Pandaily 多篇报道)。
当前焦点:BitCPM-CANN 展示了低比特训练在国产芯片上的可行性,但其在实际应用中的性能与通用性仍有待验证。未来观察点在于:1)1.58-bit 模型的精度能否满足主流任务需求;2)该框架能否广泛适配更多国产硬件生态,推动端侧高效部署。