AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:Kimi 2.7×
6月29日
00:01
00:01Clement Delangue@ClementDelangue
Brian Armstrong在推文中分享了Coinbase控制AI成本的实践。他提到,通过将默认模型切换到开源模型如GLM 5.2和Kimi 2.7,91%的员工从未触及使用上限。通过改进缓存,LibreChat的缓存命中率从5%提升到60%。这些措施使AI支出减少近一半,同时token用量仍在增长。他还强调路由优化和精简上下文的重要性。
技巧Hugging FaceGLM 5.2Kimi 2.7成本优化缓存

推荐理由:Coinbase创始人Brian Armstrong分享了一套实际操作方案:用更便宜的默认模型、优化缓存和路由,能把AI成本砍半。开源模型GLM 5.2和Kimi 2.7是主角,缓存命中率从5%跳到60%。
原文
6月28日
20:24
20:24Decoder@Matthias Bastian
精选
Coinbase CEO Brian Armstrong将公司系统切换至中国AI模型GLM 5.2和Kimi 2.7。自动路由系统根据任务和价格选择最佳模型,缓存命中率从5%提升至60%。尽管token使用量持续增长,Coinbase的AI支出已减半。此举凸显西方AI实验室正面临定价压力测试。
行业CoinbaseGLM 5.2Kimi 2.7成本优化定价压力

推荐理由:Coinbase用GLM 5.2和Kimi 2.7替换了西方模型,成本砍半,缓存命中率翻了12倍。想知道为什么中国模型更便宜?
原文
6月27日
12:17
12:17Harrison Chase@hwchase17
Coinbase CEO Brian Armstrong在推文中介绍了公司通过更优默认设置、智能路由和缓存来控制AI支出增长。他们默认使用开源模型如GLM 5.2和Kimi 2.7,使91%员工未触发使用上限。缓存命中率在LibreChat中从5%提升至60%。这些措施使AI支出降低近一半,同时token使用量持续增长。
技巧成本优化缓存CoinbaseGLM 5.2Kimi 2.7

推荐理由:Coinbase用缓存和默认模型省了一半钱,还让token随便用,想省成本的团队可以照抄作业。
原文
6月17日
09:34
09:34Fireworks AI@FireworksAI_HQ
Kimi 2.7 现已完全在 Fireworks 上可训练,支持 SFT、DPO、RL 等训练方式。用户可以使用自己的数据微调模型,构建比前沿模型成本更低的护城河。Fireworks 提供托管点击或原始 API,支持大上下文和巨大 LoRA 秩。
AI产品Kimi 2.7Fireworks微调模型训练

推荐理由:Fireworks 让你拿 Kimi 2.7 自己训练,便宜还能干翻前沿模型,想定制模型的赶紧试试。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
精选全部日报登录