bitcpmcann·general

BitCPM-CANN

别名
首次出现
2026-05-22
最近出现
2026-05-26
累计提及
13
§ 01综述

大模型训练和部署对算力的需求持续攀升,业界探索低比特量化等技术以降低成本并适配国产硬件。近期,面壁智能与清华大学联合开源了 BitCPM-CANN,这是一个基于华为昇腾 CANN 计算架构的 1.58-bit 三元大模型训练框架,实现在国产计算设备上的极低比特训练。

  • 面壁智能联合清华开源首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN(IT之家)。该模型参数以三元(-1, 0, +1)表示,大幅降低内存占用和计算开销,可在昇腾芯片上高效训练。
  • 模型基于全中文基础设施(包括数据、训练框架)进行训练,是首个支持国产芯片完成 1.58-bit 模型训练的公开方案(X 平台 rohanpaul_ai)。
  • 该开源项目由面壁智能与 Bingbi AI 等机构推动,旨在探索在国产算力环境下实现极致低比特量化的可能性,降低大模型对高端 GPU 的依赖(Pandaily 多篇报道)。
  • 当前焦点:BitCPM-CANN 展示了低比特训练在国产芯片上的可行性,但其在实际应用中的性能与通用性仍有待验证。未来观察点在于:1)1.58-bit 模型的精度能否满足主流任务需求;2)该框架能否广泛适配更多国产硬件生态,推动端侧高效部署。

    § 02相关报道04 条在档
    1. 01
      Model Best 开源 BitCPM-CANN:国产芯片实现 1.58-bit 训练
      pandaily
    2. 02
      Bingbi AI 开源 BitCPM-CANN:1.58-bit 训练框架,国产算力可用
      pandaily
    3. 03
      面壁智能联合清华开源首个基于华为昇腾训练的1.58-bit端侧大模型BitCPM-CANN
      IT之家
    4. 04
      BitCPM-CANN 开源:首个全中文基础设施训练的 1.58-bit 三元 LLM
      rohanpaul_ai
    § 03邻近话题

    本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

    /topic/BitCPM-CANN