AI模型精选70°

面壁智能 MiniCPM-V 4.6 开源:1.3B 参数仅需 6G 内存

面壁智能 MiniCPM-V 4.6 发布开源:1.3B 参数仅需 6G 内存即可流畅运行

精选理由

1.3B模型6G内存就能跑

AI 摘要

面壁智能联合清华大学及 OpenBMB 开源社区发布 MiniCPM-V 4.6,参数规模 1.3B,仅需约 6GB 内存即可在端侧流畅运行。该模型在 Artificial Analysis 评测中以 13 分超越 Ministral 3 3B,整体能力接近 Qwen3.5-2B 级别。效率方面,基于 vLLM 框架的 Token 吞吐量是 Qwen3.5-0.8B 的 1.5 倍,计算 Token 消耗仅为后者的 2.5%。技术创新包括 LLaMA-UHD v4 架构,将图像编码计算量降低 55.8%,处理 3132×3132 高清图首字延迟仅 75.7 毫秒。模型已全面开源,支持 iOS、Android 和 HarmonyOS 等系统。

AI 翻译 · 中文

面壁智能联合清华大学及 OpenBMB 开源社区发布 MiniCPM-V 4.6,参数规模 1.3B,仅需约 6GB 内存即可在端侧流畅运行。该模型在 Artificial Analysis 评测中以 13 分超越 Ministral 3 3B,整体能力接近 Qwen3.5-2B 级别。效率方面,基于 vLLM 框架的 Token 吞吐量是 Qwen3.5-0.8B 的 1.5 倍,计算 Token 消耗仅为后者的 2.5%。技术创新包括 LLaMA-UHD v4 架构,将图像编码计算量降低 55.8%,处理 3132×3132 高清图首字延迟仅 75.7 毫秒。模型已全面开源,支持 iOS、Android 和 HarmonyOS 等系统。

IT之家IT之家 5 月 13 日消息,5 月 11 日,面壁智能联合清华大学及 OpenBMB 开源社区正式发布并开源了新一代端侧多模态大模型 MiniCPM-V 4.6。 该模型参数规模为 1.3B,在端侧设备上仅需约 6GB 内存即可流畅运行,大幅降低了多模态 AI 在各类智能终端的落地门槛。 目前,MiniCPM-V 4.6 已在 GitHub 和 Hugging Face 等平台全面开源,并提供 Testflight 测试版本,可在