06:18Gary Marcus@GaryMarcusGLM 5.2 被称作开源界的 Claude 时刻,在 Databricks 平台上需求惊人。Yuchen Jin 指出,该模型遵循已知公式,导致技术壁垒消失、市场趋同、价格战开始,利润率趋小或为负。越来越多公司将转向基于开源模型进行后训练并拥有权重。GaryMarcus 认为这是其三年来论证的无技术护城河、价格战、低利润率趋势的最终体现。AI模型GLM开源模型价格战DatabricksAI市场推荐理由:GLM 5.2 开源版火了,Databricks 上抢着用,价格战要来了,想用低成本模型得看看这个趋势。原文
10:02shao__meng@shao__meng71°Snowflake CEO使用103个dbt任务对GLM和Opus进行3轮测试。GLM原始token消耗860M,Opus 439M,差距约2倍。差距源于GLM平均轮次99次(Opus 80次)、工具调用为原子化(Opus批量化)、缓存命中率53%(Opus 96%)。尾部失败案例主导均值:少数任务中GLM陷入400+次调用。归一化到90%缓存率后,GLM成本$1.12/session,Opus $2.14/session,GLM便宜48%。AI模型GLMOpusSnowflake推理模型成本对比推荐理由:Snowflake CEO用103个真实任务实测GLM和Opus,发现调整缓存后GLM成本不到Opus一半,适合注重预算的团队。原文
01:24lmarena.ai@lmarena_ai精选Zai_org的GLM系列在Code Arena: Frontend基准上持续增长,GLM-4.6得分1408,GLM-5.2 (Max)达到1595,超越Opus 4.8并逼近Claude Fable 5的1665分。GLM-5.2 (Max)是该实验室最强的编码模型,在HTML/React真实任务上缩小了与前沿实验室的差距。该模型为开源发布。AI模型GLMZai_orgCode Arena前端编码开源模型推荐理由:Zai_org的GLM-5.2开源模型在前端编码上超过了Opus,离领先的Claude Fable只差一点,值得试试原文
14:25OpenRouter@OpenRouterAIOpenRouter 分享了 GLM 和 DeepSeek 两个模型家族的版本采用时间线图。数据展示了用户在不同版本之间的迁移趋势。图表包含 2 条回复、2 次转发、29 个喜欢和 3042 次查看。这反映了开源模型社区的版本使用动态。行业OpenRouterGLMDeepSeek模型采用版本迁移推荐理由:想了解 GLM 和 DeepSeek 用户都升级到了哪个版本?OpenRouter 这张图一目了然。原文
01:35Marc Andreessen@pmarcaa16z 创始人 Marc Andreessen 发推称“有趣”,并提及 Z.ai 创始人、GLM AI 模型的创造者。该推文获得 48 条回复、40 次转发和 617 个点赞,引发行业关注。Z.ai 和 GLM 模型的具体动向尚未明确。行业Z.aiGLMMarc Andreessen行业动态推荐理由:a16z 大佬 Marc Andreessen 点名 Z.ai 和 GLM 模型,看看谁被盯上了。原文
00:35Geek@geekbb从2022年期待本地运行ChatGPT-3.5,到2026年DeepSeek、Qwen、GLM、Kimi每月发布旗舰模型。本地部署模型列表包括GLM-4、DeepSeek R1/V3、Qwen3、Kimi-K2、GPT-oss-120b、Qwen3.7-Plus、Kimi-K2.7、Deepseek-V4、GLM-5.2等九个版本。迭代速度远超预期,社区感叹没有尽头。行业DeepSeekQwenGLMKimi国产模型推荐理由:这帖子把2022到2026国产模型进化史盘得清清楚楚,DeepSeek、Qwen、GLM、Kimi每月一个旗舰,本地部署清单都快十个版本了,AI发烧友必看。原文
11:20arXiv: OpenAI@Ziyue Wang, Cheuk Wang Maurice Ng, Chenchen Yu, Strick Sheng, Kaihua Qin, Liyi ZhouEvoHunt是一个在开源仓库上运行的安全审计剧本进化环境。它使用三个智能体驱动循环:审计智能体执行当前剧本,评估器根据真实情况打分,修订者根据失败分析更新剧本。在开源安全公告评估中,EvoHunt使Codex/GPT5.4-xhigh的端到端漏洞利用成功率从1.1%提升至6.2%。GLM5.1演变出的剧本在目标匹配率上达到11.3%,超过OpenAI Codex Security的9.2%。转移实验显示,Qwen3.6-27B借助GLM剧本从2.4%提升至6.5%,Qwen3.6-35B-A3B从1.1%提升至4.6%。论文EvoHuntCodexGLMQwen智能体安全审计10 个信源在谈推荐理由:这篇论文讲EvoHunt,能自动生成安全审计剧本,还能把经验迁移给弱模型,效果比商用产品还好。原文
02:52rohanpaul_ai@rohanpaul_ai精选72°研究发现,大型混合专家(MoE)模型在处理许多简单token时,浪费了约一半的专家计算资源。新提出的ZEDA(零专家自蒸馏适应)框架,通过为路由器添加“零专家”选项,让模型在token不需要复杂处理时直接跳过专家计算。该方法无需重新训练,而是将原MoE模型作为冻结教师,通过自蒸馏学习何时安全跳过计算。在Qwen3-30B-A3B和GLM-4.7-Flash上测试,去除了约50%的专家计算,精度损失极小,实际推理速度提升约20%。这表明计算消耗并不简单跟随任务难度,而是与不确定性相关,为部署MoE模型提供了更经济的方案。论文MoE模型优化推理加速自蒸馏Qwen3GLM推荐理由:部署MoE模型的团队终于可以省下一半专家计算——ZEDA让Qwen3和GLM等模型自动跳过简单token,推理速度提升20%且几乎不掉精度,做模型推理优化的开发者可以直接参考论文方法。原文
11:39Tw93@HiTw93精选Kaku 终端发布 V0.11.0 版本,这是一款为 AI 编程设计的快速、开箱即用的终端。新版本增加了对 DeepSeek、GLM、Kimi、Fireworks 等模型的隐藏推理支持,改进了会话恢复和初始化设置体验。同时修复了全屏标签、标题栏拖拽、光标渲染、低 DPI 文本和彩色 emoji 大小等细节问题。AI 流式传输、输入法输入、代理处理和多提供商传输也更加稳定。AI产品AI 编程终端KakuDeepSeekGLM推荐理由:Kaku 把 AI 作为终端的一等公民,做 AI 编程的开发者可以直接用它替代传统终端,体验更流畅的 AI 交互。原文
01:41berryxia@berryxiaSlides Arena 发布了基于 370 万+ 真实创作者使用场景的 Agentic Slides 排行榜,Anthropic 的 Opus 4.7 包揽前两名,智谱的 GLM 5.1 位列第三。该排行榜基于真实世界的幻灯片生成场景,强调逻辑、创意和设计感,而非实验室 benchmark。结果显示 Claude 在 Agentic 设计领域仍具领先优势,但 GLM 表现亮眼。AI产品GLMOpusAgentic SlidesPPT设计排行榜10 个信源在谈推荐理由:做 PPT 设计或 Agentic 内容生成的团队,这份基于 370 万真实场景的排行榜值得参考——GLM 5.2 能紧追 Opus 4.7,说明国产模型在创意密集型任务上已有竞争力,建议点开看看完整榜单。原文
19:15Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue在特朗普与习近平会晤期间,呼吁美国AI社区公开支持开源国际AI,特别是来自中国的Deepseek、Qwen、Kimi、GLM等模型。他强调开源是当前AI领域竞争、就业和财富创造的最重要驱动力。此举意在关键时刻维护开源合作,避免地缘政治影响技术交流。行业开源/仓库DeepseekQwenKimiGLM推荐理由:开源AI社区正面临地缘政治压力,Hugging Face CEO的呼吁提醒从业者:支持开源模型(尤其是中国模型)关乎整个行业的竞争力和创新活力。做AI开发或关注开源生态的人,值得关注这一立场。原文