AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:API降价×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月28日
10:33
10:33IT之家(博客/媒体)
83°
小米 MiMo 官方宣布 MiMo-V2.5 系列 API 永久降价,最高降幅达 99%,且不再区分上下文窗口长度。小米 MiMo 负责人罗福莉在 X 平台发文解释,降价主要得益于推理框架对 SWA 的分层 KV 缓存优化,将缓存 Token 容量提升 5 倍,降低 80% 缓存成本。此外,模型架构的 1:7 Full:SWA 稀疏比使原始推理成本远低于行业平均水平,留有 2 到 3 倍利润空间。降价后,生产推理引擎接近满负载运行,仍能维持收支平衡。罗福莉认为,合理定价的 API 将驱动真实推理需求,拉动 AI 基础设施链发展,形成良性循环。
AI产品MiMoAPI降价推理优化KV缓存成本优势

推荐理由:小米 MiMo 用架构和推理优化把 API 价格打下来,做 AI 应用开发的团队可以直接用更低成本调用高性能模型,建议关注后续技术博客。
原文
5月27日
11:23
11:23IT之家(博客/媒体)
小米 MiMo 官方宣布对 MiMo-V2.5 系列 API 进行永久降价,最高降幅达 99%,且不再区分上下文窗口长度。同时优化了 Token Plan 计费体系,用量提升至原来的 5-8 倍,计费规则更加清晰。所有已订阅 Token Plan 且仍在有效期的用户,其 Credits 额度将于北京时间 5 月 27 日 0:00 全量重置,并按新规则执行。此外,小米「百万亿 Token 创造者激励计划」的 100T Tokens 已全部发放完毕,活动提前收官。
AI产品小米MiMo-V2.5API降价Token Plan计费优化

推荐理由:小米 API 大幅降价,最高降幅 99%,用量提升 5-8 倍,做 AI 应用开发或调用模型的团队成本将大幅降低,建议开发者关注并调整预算。
原文
精选全部日报登录