万亿参数模型·general

万亿参数模型

别名
首次出现
2026-06-08
最近出现
2026-06-10
累计提及
5
§ 01综述

万亿参数模型正从理论验证走向工程落地,近期两大进展引发关注。一方面,小米发布的MiMo V2.5 Pro UltraSpeed版本据称在边缘设备上实现每秒超1000 token的推理速度,宣称这是万亿参数模型的“10倍输出体验”;另一方面,昇腾910C芯片完成对1.6万亿参数模型的全参数后训练,标志着国产AI算力在集群训练能力上跨过关键门槛。

  • 小米MiMo V2.5 Pro UltraSpeed实测显示,该模型在低延迟场景下输出速度可达1000 tokens/s以上,但需结合上下文(如缓存、量化)理解实际效果,且其“万亿参数”的具体规模与稀疏性需进一步确认。(原文标题: MiMo V2.5 Pro UltraSpeed 实测:每秒超1000 Token](https://x.com/op7418/status/2064576912648015886))
  • 小米同步推出MiMo-V2.5-Pro UltraSpeed模式,通过动态稀疏和级联推理架构,以约3倍成本换来10倍的推理吞吐,但模型参数量与通用性仍需验证。(原文标题: 小米发布 MiMo-V2.5-Pro UltraSpeed 模式,3 倍价格 10 倍输出体验](https://www.ithome.com/0/961/659.htm))
  • 昇腾910C集群成功完成1.6万亿参数的完整后训练,涵盖优化器状态、梯度和模型参数的全量更新,该训练基于国产硬件与框架,证明国产算力已具备支撑超大规模模型的基础能力。(原文标题: 昇腾910C完成1.6万亿参数模型全参数后训练,国产AI算力跨越关键门槛](https://pandaily.com/ascend-910c-1-6-trillion-parameter-training-jun2026))
  • 当前焦点在于:万亿参数模型是否真正具备可落地的推理效率,以及国产算力能否在训练和推理两端持续突破。未来需观察小米UltraSpeed技术的通用性与昇腾生态对更大规模模型(如3万亿参数)的支持能力。

    § 02相关报道04 条在档
    1. 01
      MiMo V2.5 Pro UltraSpeed 实测:每秒超1000 Token
      歸藏(guizang.ai)
    2. 02
      小米 MiMo V2.5-Pro-UltraSpeed 突破万亿参数模型千 tokens/s 输出
      IT之家
    3. 03
      小米发布 MiMo-V2.5-Pro UltraSpeed 模式,3 倍价格 10 倍输出体验
      IT之家
    4. 04
      昇腾910C完成1.6万亿参数模型全参数后训练,国产AI算力跨越关键门槛
      Pandaily
    § 03邻近话题

    本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

    /topic/%E4%B8%87%E4%BA%BF%E5%8F%82%E6%95%B0%E6%A8%A1%E5%9E%8B