13:55歸藏(guizang.ai)@op741876°MiMo 推出了 V2.5 Pro UltraSpeed 模型,实现每秒输出超过 1000 Token,成为全球首个达到此速度的万亿参数模型。博主归藏进行了三项测试,包括复杂 3D 游戏和官网动画生成,峰值速度达 1426 Token/s,首次响应最快仅 0.83 秒。该模型在保持高速度的同时未出现能力下降,优于此前 Groq 等方案。这种超高速推理在 Agent 场景下能显著提升效率,尤其适合并发 Sub-Agent 任务。MiMo 主要面向对效率要求极高的 To B 客户,未来有望优化成本惠及普通用户。AI模型MiMo超高速推理万亿参数模型Agent效率3D生成推荐理由:MiMo 把万亿参数模型的推理速度拉到 1000+ Token/s,做 Agent 和实时交互的开发者值得关注——速度提升直接缩短任务等待时间,并发场景下体验翻倍。原文
15:00IT之家(博客/媒体)88°小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro-UltraSpeed 模式,首次在 1 万亿参数模型上实现超过 1000 tokens/s 的输出速度。该模式 API 已上线,定价为原版的 3 倍,但输出速度提升约 10 倍。由于高速推理资源有限,该模式采取申请制限时开放,申请通过的用户可在 2026 年 6 月 9 日至 6 月 23 日期间免费体验 Chat 功能,每日最多 10 次会话,每次最长 30 分钟。这一突破标志着万亿参数模型在实时推理场景中的实用化迈出关键一步。AI模型万亿参数模型推理速度MiMoTileRTAPI推荐理由:万亿参数模型首次达到千 tokens/s 输出,做大规模推理或实时 AI 应用的团队可以直接申请体验,看看能否真正落地到生产环境。原文
00:27IT之家(博客/媒体)78°小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro 的 UltraSpeed 模式,通过模型与系统的极致协同设计,在通用 GPU 上将万亿参数模型的生成速度首次突破 1000 tokens/s。该模式 API 同步上线,定价为原版的 3 倍,但输出速度提升约 10 倍。由于高速推理资源有限,该模式采取申请制限时开放,时间从 2026 年 6 月 9 日至 6 月 23 日,优先审核有真实业务需求的企业与开发者。通过审核的用户可获得限时免费的 Chat 体验,但每日最多成功进入队列 10 次,单次会话时长上限 30 分钟。AI产品小米 MiMoUltraSpeed 模式万亿参数模型高速推理API 体验推荐理由:万亿参数模型生成速度首次突破 1000 tokens/s,做高吞吐 AI 应用的企业和开发者值得申请体验,3 倍价格换 10 倍输出效率,性价比极高。原文
09:52Pandaily@contact@pandaily.com (Pandaily)精选72°深圳河套学院联合哈工大(深圳)、深圳大数据研究院及华为,成功使用昇腾910C芯片完成了1.6万亿参数大模型的全参数后训练。这一成果标志着国产AI算力首次支撑万亿级参数模型的完整训练流程,突破了此前依赖国外高端GPU的瓶颈。项目验证了昇腾910C在大规模分布式训练中的稳定性和效率,为国内大模型自主训练提供了可行的硬件基础。该突破对降低AI研发成本、保障技术安全具有重要意义。AI产品昇腾910C国产算力万亿参数模型全参数训练华为推荐理由:国产算力终于跑通万亿参数模型全流程,做AI训练和模型研发的团队值得关注——这直接关系到未来能否摆脱对英伟达的依赖,建议点开了解技术细节。原文