万亿参数模型

§ 01综述

万亿参数模型正从理论验证走向工程落地，近期两大进展引发关注。一方面，小米发布的MiMo V2.5 Pro UltraSpeed版本据称在边缘设备上实现每秒超1000 token的推理速度，宣称这是万亿参数模型的“10倍输出体验”；另一方面，昇腾910C芯片完成对1.6万亿参数模型的全参数后训练，标志着国产AI算力在集群训练能力上跨过关键门槛。

小米MiMo V2.5 Pro UltraSpeed实测显示，该模型在低延迟场景下输出速度可达1000 tokens/s以上，但需结合上下文（如缓存、量化）理解实际效果，且其“万亿参数”的具体规模与稀疏性需进一步确认。(原文标题: MiMo V2.5 Pro UltraSpeed 实测：每秒超1000 Token](https://x.com/op7418/status/2064576912648015886))

小米同步推出MiMo-V2.5-Pro UltraSpeed模式，通过动态稀疏和级联推理架构，以约3倍成本换来10倍的推理吞吐，但模型参数量与通用性仍需验证。(原文标题: 小米发布 MiMo-V2.5-Pro UltraSpeed 模式，3 倍价格 10 倍输出体验](https://www.ithome.com/0/961/659.htm))

昇腾910C集群成功完成1.6万亿参数的完整后训练，涵盖优化器状态、梯度和模型参数的全量更新，该训练基于国产硬件与框架，证明国产算力已具备支撑超大规模模型的基础能力。(原文标题: 昇腾910C完成1.6万亿参数模型全参数后训练，国产AI算力跨越关键门槛](https://pandaily.com/ascend-910c-1-6-trillion-parameter-training-jun2026))

当前焦点在于：万亿参数模型是否真正具备可落地的推理效率，以及国产算力能否在训练和推理两端持续突破。未来需观察小米UltraSpeed技术的通用性与昇腾生态对更大规模模型（如3万亿参数）的支持能力。

§ 02相关报道04 条在档

§ 03邻近话题