tilert·general

TileRT

别名
首次出现
2026-05-22
最近出现
2026-06-09
累计提及
8
§ 01综述

近期,大语言模型推理速度竞赛加速,小米与智谱相继推出高速版本。背景方面,随着模型参数规模突破万亿,如何降低端侧推理延迟成为关键痛点。

当前焦点 / 未来观察点:
当前焦点在于“高速”是否能真正落地商用:小米的 UltraSpeed 模式以成本换速度,定价策略是否会被大规模部署接受;智谱则更注重普惠性。未来需观察:这些高速模型在复杂推理任务上的准确性是否下降?是否会推动更多厂商推出类似“涡轮模式”?此外,单节点吞吐量与多节点分布式推理之间的取舍,也将成为行业趋势。

§ 02相关报道04 条在档
  1. 01
    小米 MiMo V2.5-Pro-UltraSpeed 突破万亿参数模型千 tokens/s 输出
    IT之家
  2. 02
    小米MiMo-V2.5-Pro-UltraSpeed:单节点8卡实现1T模型1000+ tokens/s
    xiaomimimo
  3. 03
    小米发布 MiMo-V2.5-Pro UltraSpeed 模式,3 倍价格 10 倍输出体验
    IT之家
  4. 04
    智谱 GLM-5.1 高速版发布,输出速度达 400 tokens/s
    IT之家
§ 03邻近话题

本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

/topic/TileRT