03:09Sebastian Raschka@rasbt73°GLM-5.2是智谱发布的最新开放权重模型,基于GLM-5和GLM-5.1架构,复用了DeepSeek V3.2的Multi-head Latent Attention(MLA)和DeepSeek Sparse Attention(DSA)机制。新增的IndexShare机制在每四层运行一次完整索引器,后续三层复用选中的token索引,使100万token推理成本大幅降低。目前GLM-5.2在开放权重模型中表现最佳。AI模型GLM-5.2DeepSeek V3.2IndexShare推理模型开源模型2 个信源在谈推荐理由:智谱的GLM-5.2开放权重模型,用DeepSeek V3.2的注意力机制加上自己的IndexShare,把1M长上下文推理搞便宜了,值得看看。原文
01:14OpenRouter@OpenRouterAIDigitalOcean 的 AI-Native Cloud 现已作为新供应商接入 OpenRouter 平台,提供高性能推理服务。该服务支持多种热门开源模型,在 DeepSeek V3.2 模型上输出速度和延迟均排名第一,数据由 Artificial Analysis 验证。开发者可通过 OpenRouter 直接调用这些模型,获得更快的响应体验。AI产品DigitalOceanOpenRouter推理模型云服务DeepSeek V3.2推荐理由:做 AI 应用开发或需要快速推理的团队,现在可以在 OpenRouter 上直接使用 DigitalOcean 的高性能云服务,DeepSeek V3.2 的速度优势值得一试。原文
12:44Viking@vikingmute精选中国电信开始销售token,融合自研星辰大模型与DeepSeek V3.2等生态大模型。目前具体定价和开放范围尚未公布。此举标志着电信运营商正式进入大模型商业化领域,提供算力与模型调用服务。行业中国电信星辰大模型DeepSeek V3.2token1 个信源在谈推荐理由:电信也来卖token了原文