面壁智能近期在端侧AI模型和开源生态上动作密集,展现出“小参数、高性能”的技术路线。其核心产品MiniCPM系列已迭代至5-1B与V 4.6版本,同时推出训练框架ForgeTrain和昇腾适配方案,试图降低大模型部署门槛。
- 近期主要进展包括:
- 开源全球首个AI编写生产级训练框架ForgeTrain:该框架支持自动化训练流程,旨在提升模型开发效率,面壁智能将其开源以推动社区协作。(面壁智能开源全球首个AI编写生产级训练框架ForgeTrain)
- 发布MiniCPM5-1B:仅1B参数,却在多个基准测试中超越所有2B以下模型,且支持在手机浏览器上运行,凸显其极致轻量和高效推理能力。(面壁智能开源 MiniCPM5-1B)
- 联合清华开源1.58-bit端侧大模型BitCPM-CANN:基于华为昇腾硬件,实现低比特量化与训练,进一步降低端侧部署算力需求。(面壁智能联合清华开源首个基于华为昇腾训练的1.58-bit端侧大模型BitCPM-CANN)
- MiniCPM-V 4.6视觉模型开源:1.3B参数仅需6G内存,在视觉问答等任务上表现强劲,强化了端侧多模态能力。(MiniCPM-V 4.6开源:1.3B参数仅需6G内存)
当前焦点在于面壁智能能否通过开源生态和技术创新,持续缩小端侧模型与云端大模型的性能差距,并吸引开发者与应用场景落地。未来值得观察的是其训练框架ForgeTrain的社区采用率,以及BitCPM在国产芯片生态中的适配进展。