全部 AI 动态 · AI 热点

6月19日

03:09

03:09

Sebastian Raschka@rasbt

73°

GLM-5.2是智谱发布的最新开放权重模型，基于GLM-5和GLM-5.1架构，复用了DeepSeek V3.2的Multi-head Latent Attention（MLA）和DeepSeek Sparse Attention（DSA）机制。新增的IndexShare机制在每四层运行一次完整索引器，后续三层复用选中的token索引，使100万token推理成本大幅降低。目前GLM-5.2在开放权重模型中表现最佳。

AI模型 GLM-5.2 DeepSeek V3.2 IndexShare 推理模型开源模型

推荐理由：智谱的GLM-5.2开放权重模型，用DeepSeek V3.2的注意力机制加上自己的IndexShare，把1M长上下文推理搞便宜了，值得看看。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月3日

01:14

01:14

OpenRouter@OpenRouterAI

DigitalOcean 的 AI-Native Cloud 现已作为新供应商接入 OpenRouter 平台，提供高性能推理服务。该服务支持多种热门开源模型，在 DeepSeek V3.2 模型上输出速度和延迟均排名第一，数据由 Artificial Analysis 验证。开发者可通过 OpenRouter 直接调用这些模型，获得更快的响应体验。

AI产品 DigitalOcean OpenRouter 推理模型云服务 DeepSeek V3.2

推荐理由：做 AI 应用开发或需要快速推理的团队，现在可以在 OpenRouter 上直接使用 DigitalOcean 的高性能云服务，DeepSeek V3.2 的速度优势值得一试。

5月18日

12:44

12:44

Viking@vikingmute

精选

中国电信开始销售token，融合自研星辰大模型与DeepSeek V3.2等生态大模型。目前具体定价和开放范围尚未公布。此举标志着电信运营商正式进入大模型商业化领域，提供算力与模型调用服务。

行业中国电信星辰大模型 DeepSeek V3.2 token

推荐理由：电信也来卖token了