全部 AI 动态 · AI 热点

6月29日

06:18

Gary Marcus@GaryMarcus

GLM 5.2 被称作开源界的 Claude 时刻，在 Databricks 平台上需求惊人。Yuchen Jin 指出，该模型遵循已知公式，导致技术壁垒消失、市场趋同、价格战开始，利润率趋小或为负。越来越多公司将转向基于开源模型进行后训练并拥有权重。GaryMarcus 认为这是其三年来论证的无技术护城河、价格战、低利润率趋势的最终体现。

AI模型 GLM 开源模型价格战 Databricks AI市场

推荐理由：GLM 5.2 开源版火了，Databricks 上抢着用，价格战要来了，想用低成本模型得看看这个趋势。

原文

6月26日

10:02

shao__meng@shao__meng

71°

Snowflake CEO使用103个dbt任务对GLM和Opus进行3轮测试。GLM原始token消耗860M，Opus 439M，差距约2倍。差距源于GLM平均轮次99次（Opus 80次）、工具调用为原子化（Opus批量化）、缓存命中率53%（Opus 96%）。尾部失败案例主导均值：少数任务中GLM陷入400+次调用。归一化到90%缓存率后，GLM成本$1.12/session，Opus $2.14/session，GLM便宜48%。

AI模型 GLM Opus Snowflake 推理模型成本对比

推荐理由：Snowflake CEO用103个真实任务实测GLM和Opus，发现调整缓存后GLM成本不到Opus一半，适合注重预算的团队。

原文

01:24

lmarena.ai@lmarena_ai

精选

Zai_org的GLM系列在Code Arena: Frontend基准上持续增长，GLM-4.6得分1408，GLM-5.2 (Max)达到1595，超越Opus 4.8并逼近Claude Fable 5的1665分。GLM-5.2 (Max)是该实验室最强的编码模型，在HTML/React真实任务上缩小了与前沿实验室的差距。该模型为开源发布。

AI模型 GLM Zai_org Code Arena 前端编码开源模型

推荐理由：Zai_org的GLM-5.2开源模型在前端编码上超过了Opus，离领先的Claude Fable只差一点，值得试试

原文

6月23日

14:25

OpenRouter@OpenRouterAI

OpenRouter 分享了 GLM 和 DeepSeek 两个模型家族的版本采用时间线图。数据展示了用户在不同版本之间的迁移趋势。图表包含 2 条回复、2 次转发、29 个喜欢和 3042 次查看。这反映了开源模型社区的版本使用动态。

行业 OpenRouter GLM DeepSeek 模型采用版本迁移

推荐理由：想了解 GLM 和 DeepSeek 用户都升级到了哪个版本？OpenRouter 这张图一目了然。

原文

6月19日

01:35

Marc Andreessen@pmarca

a16z 创始人 Marc Andreessen 发推称“有趣”，并提及 Z.ai 创始人、GLM AI 模型的创造者。该推文获得 48 条回复、40 次转发和 617 个点赞，引发行业关注。Z.ai 和 GLM 模型的具体动向尚未明确。

行业 Z.ai GLM Marc Andreessen 行业动态

推荐理由：a16z 大佬 Marc Andreessen 点名 Z.ai 和 GLM 模型，看看谁被盯上了。

原文

6月18日

00:35

Geek@geekbb

从2022年期待本地运行ChatGPT-3.5，到2026年DeepSeek、Qwen、GLM、Kimi每月发布旗舰模型。本地部署模型列表包括GLM-4、DeepSeek R1/V3、Qwen3、Kimi-K2、GPT-oss-120b、Qwen3.7-Plus、Kimi-K2.7、Deepseek-V4、GLM-5.2等九个版本。迭代速度远超预期，社区感叹没有尽头。

行业 DeepSeek Qwen GLM Kimi 国产模型

推荐理由：这帖子把2022到2026国产模型进化史盘得清清楚楚，DeepSeek、Qwen、GLM、Kimi每月一个旗舰，本地部署清单都快十个版本了，AI发烧友必看。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

11:20

arXiv: OpenAI@Ziyue Wang, Cheuk Wang Maurice Ng, Chenchen Yu, Strick Sheng, Kaihua Qin, Liyi Zhou

EvoHunt是一个在开源仓库上运行的安全审计剧本进化环境。它使用三个智能体驱动循环：审计智能体执行当前剧本，评估器根据真实情况打分，修订者根据失败分析更新剧本。在开源安全公告评估中，EvoHunt使Codex/GPT5.4-xhigh的端到端漏洞利用成功率从1.1%提升至6.2%。GLM5.1演变出的剧本在目标匹配率上达到11.3%，超过OpenAI Codex Security的9.2%。转移实验显示，Qwen3.6-27B借助GLM剧本从2.4%提升至6.5%，Qwen3.6-35B-A3B从1.1%提升至4.6%。

论文 EvoHunt Codex GLM Qwen 智能体安全审计

推荐理由：这篇论文讲EvoHunt，能自动生成安全审计剧本，还能把经验迁移给弱模型，效果比商用产品还好。

原文

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月25日

02:52

rohanpaul_ai@rohanpaul_ai

精选72°

研究发现，大型混合专家（MoE）模型在处理许多简单token时，浪费了约一半的专家计算资源。新提出的ZEDA（零专家自蒸馏适应）框架，通过为路由器添加“零专家”选项，让模型在token不需要复杂处理时直接跳过专家计算。该方法无需重新训练，而是将原MoE模型作为冻结教师，通过自蒸馏学习何时安全跳过计算。在Qwen3-30B-A3B和GLM-4.7-Flash上测试，去除了约50%的专家计算，精度损失极小，实际推理速度提升约20%。这表明计算消耗并不简单跟随任务难度，而是与不确定性相关，为部署MoE模型提供了更经济的方案。

论文 MoE 模型优化推理加速自蒸馏 Qwen3 GLM

推荐理由：部署MoE模型的团队终于可以省下一半专家计算——ZEDA让Qwen3和GLM等模型自动跳过简单token，推理速度提升20%且几乎不掉精度，做模型推理优化的开发者可以直接参考论文方法。

原文

5月21日

11:39

Tw93@HiTw93

精选

Kaku 终端发布 V0.11.0 版本，这是一款为 AI 编程设计的快速、开箱即用的终端。新版本增加了对 DeepSeek、GLM、Kimi、Fireworks 等模型的隐藏推理支持，改进了会话恢复和初始化设置体验。同时修复了全屏标签、标题栏拖拽、光标渲染、低 DPI 文本和彩色 emoji 大小等细节问题。AI 流式传输、输入法输入、代理处理和多提供商传输也更加稳定。

AI产品 AI 编程终端 Kaku DeepSeek GLM

推荐理由：Kaku 把 AI 作为终端的一等公民，做 AI 编程的开发者可以直接用它替代传统终端，体验更流畅的 AI 交互。

原文

5月17日

01:41

berryxia@berryxia

Slides Arena 发布了基于 370 万+ 真实创作者使用场景的 Agentic Slides 排行榜，Anthropic 的 Opus 4.7 包揽前两名，智谱的 GLM 5.1 位列第三。该排行榜基于真实世界的幻灯片生成场景，强调逻辑、创意和设计感，而非实验室 benchmark。结果显示 Claude 在 Agentic 设计领域仍具领先优势，但 GLM 表现亮眼。

AI产品 GLM Opus Agentic Slides PPT设计排行榜

推荐理由：做 PPT 设计或 Agentic 内容生成的团队，这份基于 370 万真实场景的排行榜值得参考——GLM 5.2 能紧追 Opus 4.7，说明国产模型在创意密集型任务上已有竞争力，建议点开看看完整榜单。

原文

5月13日

19:15

Clement Delangue@ClementDelangue

Hugging Face CEO Clement Delangue在特朗普与习近平会晤期间，呼吁美国AI社区公开支持开源国际AI，特别是来自中国的Deepseek、Qwen、Kimi、GLM等模型。他强调开源是当前AI领域竞争、就业和财富创造的最重要驱动力。此举意在关键时刻维护开源合作，避免地缘政治影响技术交流。

行业开源/仓库 Deepseek Qwen Kimi GLM

推荐理由：开源AI社区正面临地缘政治压力，Hugging Face CEO的呼吁提醒从业者：支持开源模型（尤其是中国模型）关乎整个行业的竞争力和创新活力。做AI开发或关注开源生态的人，值得关注这一立场。

原文