万亿参数模型正从理论验证走向工程落地,近期两大进展引发关注。一方面,小米发布的MiMo V2.5 Pro UltraSpeed版本据称在边缘设备上实现每秒超1000 token的推理速度,宣称这是万亿参数模型的“10倍输出体验”;另一方面,昇腾910C芯片完成对1.6万亿参数模型的全参数后训练,标志着国产AI算力在集群训练能力上跨过关键门槛。
小米MiMo V2.5 Pro UltraSpeed实测显示,该模型在低延迟场景下输出速度可达1000 tokens/s以上,但需结合上下文(如缓存、量化)理解实际效果,且其“万亿参数”的具体规模与稀疏性需进一步确认。(原文标题: MiMo V2.5 Pro UltraSpeed 实测:每秒超1000 Token](https://x.com/op7418/status/2064576912648015886))