16:19pandaily@contact@pandaily.com (Pandaily)精选小米推出 MiMo-V2.5 端侧模型,参数量缩减至 1.5B 以适配手机芯片。华为则依赖 Pangu 系列,侧重多模态融合与本地推理效率。OPPO 采用 AndesGPT,vivo 推出蓝心大模型 1B 版本,均聚焦离线场景。各家竞争焦点集中于模型轻量化、隐私保护与响应速度,其中 MiMo-V2.5 在端侧推理延迟上较上代降低 40%。行业XiaomiHuaweiMiMo-V2.5Pangu端侧AI推荐理由:想看看手机厂怎么在本地跑大模型?小米 MiMo-V2.5 和华为 Pangu 打法完全不一样,这篇拆了 8 家的端侧策略。原文
00:49marktechpost@Asif Razzaq精选小米MiMo团队与TileRT发布MiMo-V2.5-Pro-UltraSpeed推理模式。该模式在单个8-GPU普通节点上,使1万亿参数模型MiMo-V2.5-Pro的译码速度超过1000 tokens/秒。这是首次在commodity GPU上实现如此高吞吐量。相比此前方案,速度提升显著。AI模型MiMoTileRTMiMo-V2.5-Pro-UltraSpeedXiaomi推理加速推荐理由:1万亿参数跑出1000t/s原文