小米发布 MiMo-V2.5-Pro UltraSpeed 模式,3 倍价格 10 倍输出体验

精选理由

万亿参数模型生成速度首次突破 1000 tokens/s,做高吞吐 AI 应用的企业和开发者值得申请体验,3 倍价格换 10 倍输出效率,性价比极高。

AI 摘要

小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro 的 UltraSpeed 模式,通过模型与系统的极致协同设计,在通用 GPU 上将万亿参数模型的生成速度首次突破 1000 tokens/s。该模式 API 同步上线,定价为原版的 3 倍,但输出速度提升约 10 倍。由于高速推理资源有限,该模式采取申请制限时开放,时间从 2026 年 6 月 9 日至 6 月 23 日,优先审核有真实业务需求的企业与开发者。通过审核的用户可获得限时免费的 Chat 体验,但每日最多成功进入队列 10 次,单次会话时长上限 30 分钟。

AI 翻译 · 中文

小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro 的 UltraSpeed 模式,通过模型与系统的极致协同设计,在通用 GPU 上将万亿参数模型的生成速度首次突破 1000 tokens/s。该模式 API 同步上线,定价为原版的 3 倍,但输出速度提升约 10 倍。由于高速推理资源有限,该模式采取申请制限时开放,时间从 2026 年 6 月 9 日至 6 月 23 日,优先审核有真实业务需求的企业与开发者。通过审核的用户可获得限时免费的 Chat 体验,但每日最多成功进入队列 10 次,单次会话时长上限 30 分钟。

IT之家IT之家 6 月 9 日消息,小米 MiMo 官方昨日宣布,与 TileRT 联合发布 Xiaomi MiMo-V2.5-Pro 的 UltraSpeed 模式,通过模型与系统的极致 Codesign, 在通用 GPU 上将万亿参数模型的生成速度首次突破 1000 tokens/s 。 ▲ 10 秒,做一个贪吃蛇小游戏 MiMo-V2.5-Pro-UltraSpeed API 同步上线,采用限时体验价, 定价为 MiMo-V2.5-Pr