22:50berryxia@berryxia本教程演示如何将低成本大模型接入沉浸式翻译插件。操作步骤包括:进入沉浸式翻译设置,点击左侧“翻译服务”,右上角添加自定义翻译服务并选择“自定义AI”。填入API Key和大模型API接口地址,例如小米MiMo模型的Base URL为https://t.co/n4qZ4OEcJQ。选择对应模型或勾选“输入自定义模型名称”,测试通过后即可使用。配置完成后可在服务选项中切换使用自定义模型。技巧沉浸式翻译MiMoAPI翻译工具教程推荐理由:教你把免费模型塞进沉浸式翻译,跟着视频几步搞定,小米MiMo也能用,省下订阅费。原文
17:43IT之家(博客/媒体)小米发布并开源 Xiaomi Miloco 2.0,基于自研 MiMo 大模型,以 Agent 形式接入 OpenClaw,实现从 Miloco 1.0 到主动智能的升级。新方案具备通用常识,可识别孩子玩刀具、老人跌倒等危险并预警。通过人脸与体态识别家庭成员,支持主动注册新成员及个性化操作。系统能沉淀家庭成员的长期习惯,在用户开口前主动执行如提醒休息、推荐场景联动等任务。硬件要求内存≥4GB、存储≥256GB,推荐 Mac mini 运行,需要米家设备和多模态大模型 API Key。AI模型Xiaomi Miloco 2.0MiMoOpenClaw智能体主动智能1 个信源在谈推荐理由:小米把全屋智能 Agent 开源了,基于 MiMo 大模型,能认人、记习惯、主动干活,自己搭一套试试。原文
13:21IT之家(博客/媒体)小米新媒体高级工程师@小米_邹師傅发文评论某大模型重新出山,表示技术竞争值得欢迎,但担忧对方可能采用刷榜、刷屏、捆绑国产算力与情怀的营销手段。他指出国内大模型圈已形成靠作品说话的氛围,如DeepSeek靠开源、MiMo靠论文、Qwen靠开发者口碑。他警告新选手若以饱和舆论轰炸入场,将污染技术赛道。小米此前已发布MiMo-V2.5系列模型并永久降价,最高降幅达99%。行业小米MiMoDeepSeekQwen行业竞争推荐理由:小米工程师谈大模型竞争,警惕营销战原文
19:18IT之家(博客/媒体)小米 MiMo 开放平台宣布将于 2026 年 6 月 30 日下线 MiMo-V2 系列四款模型(mimo-v2-pro、mimo-v2-omni、mimo-v2-flash、mimo-v2-tts),推动开发者迁移至性能更强的 V2.5 系列。平台设置了系统替换时间作为过渡:mimo-v2-pro 和 mimo-v2-omni 将于 6 月 1 日自动路由至 V2.5 对应模型,API 参数完全适配;mimo-v2-flash 和 mimo-v2-tts 于 6 月 18 日切换。其中 TTS 模型涉及音色重新映射,中国集群默认音色为“冰糖”,其他集群为“mia”。开发者需在截止日期前完成模型名称替换与业务适配,否则旧 API 将报错。AI产品小米MiMo模型下线API迁移V2.5推荐理由:小米 MiMo 模型用户注意了:V2 系列即将下线,V2.5 性能更强且 Pro 版迁移零适配成本,建议在 6 月 1 日前完成切换,避免业务中断。原文
13:55歸藏(guizang.ai)@op741876°MiMo 推出了 V2.5 Pro UltraSpeed 模型,实现每秒输出超过 1000 Token,成为全球首个达到此速度的万亿参数模型。博主归藏进行了三项测试,包括复杂 3D 游戏和官网动画生成,峰值速度达 1426 Token/s,首次响应最快仅 0.83 秒。该模型在保持高速度的同时未出现能力下降,优于此前 Groq 等方案。这种超高速推理在 Agent 场景下能显著提升效率,尤其适合并发 Sub-Agent 任务。MiMo 主要面向对效率要求极高的 To B 客户,未来有望优化成本惠及普通用户。AI模型MiMo超高速推理万亿参数模型Agent效率3D生成推荐理由:MiMo 把万亿参数模型的推理速度拉到 1000+ Token/s,做 Agent 和实时交互的开发者值得关注——速度提升直接缩短任务等待时间,并发场景下体验翻倍。原文
20:09Viking@vikingmute小米发布了 MiMo-V2.5-Pro-UltraSpeed 模型,拥有 1T 参数,生成速度达到 1000 TPS。官方演示视频显示速度极快,引发关注。目前该模型开放试用申请,但用户对其实际质量存疑,因为小米此前在 AI 模型领域知名度不高。该模型在 HackerNews 上引起讨论,速度指标令人印象深刻,但最终效果仍需实测验证。AI模型小米MiMo大模型推理速度TPS1 个信源在谈推荐理由:1T 参数模型跑出 1000 TPS 的生成速度,对追求低延迟推理的开发者来说是个值得关注的指标,建议申请试用实测质量。原文
17:09歸藏(guizang.ai)@op741878°MiMo 推出 V2.5 Pro UltraSpeed 模型,实现每秒输出超过 1000 Token,成为全球首个达到此速度的万亿参数模型。实测中,复杂 3D 游戏生成峰值达 1426 Token/s,32 秒输出 25624 Token。该模型在保持高推理速度的同时,未出现能力下降,适合 Agent 和并发场景。藏师傅的测试显示,其首次响应时间低至 0.83 秒,代码生成质量高。目前面向 To B 客户,成本有待优化。AI模型MiMo超高速模型万亿参数推理模型Agent场景推荐理由:万亿参数模型跑出 1000+ Token/s 的速度,做 Agent 和实时交互的开发者可以直接体验,效率提升肉眼可见。原文
15:00IT之家(博客/媒体)88°小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro-UltraSpeed 模式,首次在 1 万亿参数模型上实现超过 1000 tokens/s 的输出速度。该模式 API 已上线,定价为原版的 3 倍,但输出速度提升约 10 倍。由于高速推理资源有限,该模式采取申请制限时开放,申请通过的用户可在 2026 年 6 月 9 日至 6 月 23 日期间免费体验 Chat 功能,每日最多 10 次会话,每次最长 30 分钟。这一突破标志着万亿参数模型在实时推理场景中的实用化迈出关键一步。AI模型万亿参数模型推理速度MiMoTileRTAPI推荐理由:万亿参数模型首次达到千 tokens/s 输出,做大规模推理或实时 AI 应用的团队可以直接申请体验,看看能否真正落地到生产环境。原文
13:29xiaomimimo@xiaomimimo88°小米与TileRT AI合作发布MiMo-V2.5-Pro-UltraSpeed,首次在1万亿参数模型上实现超过1000 tokens/s的输出速度。该突破仅使用单个标准8-GPGPU节点,无需Cerebras的晶圆级集成或Groq的纯片上SRAM芯片。技术细节已公开,并提供限时免费试用和API服务。这标志着大模型推理效率的重大飞跃,有望推动实时AI应用的普及。AI产品小米MiMo推理加速大模型GPU推荐理由:大模型推理速度的里程碑——1T模型跑出1000+ tokens/s,做实时AI应用和推理优化的团队值得关注,可以直接申请试用体验。原文
00:49marktechpost@Asif Razzaq精选小米MiMo团队与TileRT发布MiMo-V2.5-Pro-UltraSpeed推理模式。该模式在单个8-GPU普通节点上,使1万亿参数模型MiMo-V2.5-Pro的译码速度超过1000 tokens/秒。这是首次在commodity GPU上实现如此高吞吐量。相比此前方案,速度提升显著。AI模型MiMoTileRTMiMo-V2.5-Pro-UltraSpeedXiaomi推理加速推荐理由:1万亿参数跑出1000t/s原文
00:16berryxia@berryxia精选72°小米MiMo模型近期大幅降价,背后是团队对推理系统的彻底重构。他们采用Hybrid Sliding Window Attention架构,将KVCache存储压缩至全注意力的约1/7。团队针对SWA缓存难题重新设计了KVCache管理、层级缓存和prefix-cache tree,并优化了调度策略与Prefill/Decode流水线。在真实生产流量下,有效KVCache容量提升近5倍,缓存命中率稳定在93%-95%。结合MoE配置调优和多模态推理优化,最终实现了长上下文推理成本的降低,支撑了此次降价。AI产品小米MiMo推理优化KVCacheHybrid Sliding Window Attention推荐理由:做模型推理优化的团队值得看看——小米MiMo团队用Hybrid SWA和系统级优化把成本打下来,证明了架构落地比参数更重要,建议点开了解具体实现。原文
10:33IT之家(博客/媒体)83°小米 MiMo 官方宣布 MiMo-V2.5 系列 API 永久降价,最高降幅达 99%,且不再区分上下文窗口长度。小米 MiMo 负责人罗福莉在 X 平台发文解释,降价主要得益于推理框架对 SWA 的分层 KV 缓存优化,将缓存 Token 容量提升 5 倍,降低 80% 缓存成本。此外,模型架构的 1:7 Full:SWA 稀疏比使原始推理成本远低于行业平均水平,留有 2 到 3 倍利润空间。降价后,生产推理引擎接近满负载运行,仍能维持收支平衡。罗福莉认为,合理定价的 API 将驱动真实推理需求,拉动 AI 基础设施链发展,形成良性循环。AI产品MiMoAPI降价推理优化KV缓存成本优势推荐理由:小米 MiMo 用架构和推理优化把 API 价格打下来,做 AI 应用开发的团队可以直接用更低成本调用高性能模型,建议关注后续技术博客。原文
00:16xiaomimimo@xiaomimimo小米宣布MiMo-V2.5系列API永久降价,最高降幅达99%,并统一所有上下文长度的定价。MiMo Token计划升级,同等价格下可用Token数量增加5-8倍,计费规则更简单透明。现有用户的Token计划积分将全部重置。MiMo-V2.5-TTS语音合成API限时免费。这些改进得益于MiMo堆栈的推理优化和服务效率提升。AI产品API降价推理优化MiMo定价调整Token计划推荐理由:API价格直降99%并统一定价,做AI应用开发的团队成本压力骤减,建议立即查看新定价。原文
08:47IT之家(博客/媒体)小米澎湃OS 3的小米运动健康App为部分内测设备上线了Xiaomi miclaw手表版,这是一款基于小米MiMo大模型的腕上AI助理。用户按住手表说话,语音会传至手机端处理,结果以文字回显,无需掏出手机即可完成日常操作。该功能当前为内测版本,需满足特定机型、安装Xiaomi miclaw并加入内测名单等条件。此前Xiaomi miclaw已通过中国信通院手机端智能助手评估,成为国内首批通过该评测的手机端智能体。AI产品智能体大模型MiMoXiaomi miclaw小米推荐理由:小米将AI助理延伸至手表端,实现抬腕操作,提升了智能穿戴设备的实用性,对小米生态用户有实际价值。原文