全部 AI 动态 · AI 热点

6月29日

00:01

00:01

Clement Delangue@ClementDelangue

Brian Armstrong在推文中分享了Coinbase控制AI成本的实践。他提到，通过将默认模型切换到开源模型如GLM 5.2和Kimi 2.7，91%的员工从未触及使用上限。通过改进缓存，LibreChat的缓存命中率从5%提升到60%。这些措施使AI支出减少近一半，同时token用量仍在增长。他还强调路由优化和精简上下文的重要性。

技巧 Hugging Face GLM 5.2 Kimi 2.7 成本优化缓存

推荐理由：Coinbase创始人Brian Armstrong分享了一套实际操作方案：用更便宜的默认模型、优化缓存和路由，能把AI成本砍半。开源模型GLM 5.2和Kimi 2.7是主角，缓存命中率从5%跳到60%。

6月28日

20:24

20:24

Decoder@Matthias Bastian

精选

Coinbase CEO Brian Armstrong将公司系统切换至中国AI模型GLM 5.2和Kimi 2.7。自动路由系统根据任务和价格选择最佳模型，缓存命中率从5%提升至60%。尽管token使用量持续增长，Coinbase的AI支出已减半。此举凸显西方AI实验室正面临定价压力测试。

行业 Coinbase GLM 5.2 Kimi 2.7 成本优化定价压力

推荐理由：Coinbase用GLM 5.2和Kimi 2.7替换了西方模型，成本砍半，缓存命中率翻了12倍。想知道为什么中国模型更便宜？

6月27日

12:17

12:17

Harrison Chase@hwchase17

Coinbase CEO Brian Armstrong在推文中介绍了公司通过更优默认设置、智能路由和缓存来控制AI支出增长。他们默认使用开源模型如GLM 5.2和Kimi 2.7，使91%员工未触发使用上限。缓存命中率在LibreChat中从5%提升至60%。这些措施使AI支出降低近一半，同时token使用量持续增长。

技巧成本优化缓存 Coinbase GLM 5.2 Kimi 2.7

推荐理由：Coinbase用缓存和默认模型省了一半钱，还让token随便用，想省成本的团队可以照抄作业。

6月17日

09:34

09:34

Fireworks AI@FireworksAI_HQ

Kimi 2.7 现已完全在 Fireworks 上可训练，支持 SFT、DPO、RL 等训练方式。用户可以使用自己的数据微调模型，构建比前沿模型成本更低的护城河。Fireworks 提供托管点击或原始 API，支持大上下文和巨大 LoRA 秩。

AI产品 Kimi 2.7 Fireworks 微调模型训练

推荐理由：Fireworks 让你拿 Kimi 2.7 自己训练，便宜还能干翻前沿模型，想定制模型的赶紧试试。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？