全部 AI 动态 · AI 热点

6月30日

14:21

AI Will@FinanceYF5

用户将Opus 4.8替换为Kimi K2.7进行推理任务，基准差距约8%，价格便宜11倍。代码生成从GPT-5.5替换为Qwen 3.7 Max，基准差距约18%，价格便宜7倍。智能体循环与工具调用从Sonnet 4.7替换为GLM 5.2，基准差距约3%，输入价格便宜5倍。图像生成从GPT-Image-2替换为Wan 2.5，基准差距约5%，价格便宜8倍；视频生成从Sora 2替换为Kling 3.0，差距大致相等，价格便宜6倍。30天后运营成本下降87%，输出质量平均下降4%，收入不变，且模型可本地运行、保障数据安全。

技巧 Kimi K2.7 Qwen 3.7 Max GLM 5.2 Kling 3.0 成本对比

推荐理由：他把Opus、GPT、Sonnet全换成中国模型：成本降87%，性能只降4%，收入不变。附完整迁移方法。

原文

08:44

08:44SuperTechFans（博客/媒体）

78°

Semgrep 安全团队对比多模型在 IDOR 漏洞检测上的表现，GLM 5.2 在仅给定提示下取得 39% F1，高于 Claude Code 的 32% 和 Claude Opus 4.8。该模型是智谱 AI 开源的 750B 总参数 MoE 模型，每个 token 仅激活 40B，支持 128K 上下文，采用 MIT 许可证。专业静态分析管道 Semgrep 多模态仍领先，F1 达 53%–61%，显示模型与框架的差距。

AI模型 GLM 5.2 Claude Semgrep 智谱 AI IDOR检测

推荐理由：智谱的 GLM 5.2 开源模型在安全漏洞检测上居然超过了 Claude，而且推理成本低，适合做代码审计。

原文

6月29日

17:45

Browser Use@browser_use

Browser Use 团队使用 v4 版本构建 QA 基准测试，将 GLM 5.2、Opus 4.7、GPT 5.5 和 Minimax M3 四个模型在 LLM Arena 数据集上的任务进行对比。每个模型生成网站后由人工评估打分，测试涵盖多个任务类型。结果揭示了开源权重模型在特定场景下的表现差异。

AI模型 GLM 5.2 Opus 4.7 GPT 5.5 Minimax M3 基准测试

推荐理由：他们用 Browser Use v4 搞了个新基准，测了 GLM 5.2、Opus 4.7、GPT 5.5 和 Minimax M3，人工打分告诉你谁在 QA 任务上更强。

原文

11:51

Browser Use@browser_use

Browser Use 团队对 Opus 4.7 和 GLM 5.2 进行前端设计基准测试。测试使用 Browser Use v4 工具，从 LLM Arena 数据集中选取一个 prompt。每个模型根据该 prompt 生成网站并自动评分。结果对比了这两款模型在代码生成和界面设计上的能力。

AI模型 Opus 4.7 GLM 5.2 Browser Use LLM Arena 前端生成

推荐理由：Browser Use 团队拿 Opus 4.7 和 GLM 5.2 比前端设计，一个 prompt 生成网站打分，看看谁画页面更强。

原文

00:01

Clement Delangue@ClementDelangue

Brian Armstrong在推文中分享了Coinbase控制AI成本的实践。他提到，通过将默认模型切换到开源模型如GLM 5.2和Kimi 2.7，91%的员工从未触及使用上限。通过改进缓存，LibreChat的缓存命中率从5%提升到60%。这些措施使AI支出减少近一半，同时token用量仍在增长。他还强调路由优化和精简上下文的重要性。

技巧 Hugging Face GLM 5.2 Kimi 2.7 成本优化缓存

推荐理由：Coinbase创始人Brian Armstrong分享了一套实际操作方案：用更便宜的默认模型、优化缓存和路由，能把AI成本砍半。开源模型GLM 5.2和Kimi 2.7是主角，缓存命中率从5%跳到60%。

原文

6月28日

20:24

Decoder@Matthias Bastian

精选

Coinbase CEO Brian Armstrong将公司系统切换至中国AI模型GLM 5.2和Kimi 2.7。自动路由系统根据任务和价格选择最佳模型，缓存命中率从5%提升至60%。尽管token使用量持续增长，Coinbase的AI支出已减半。此举凸显西方AI实验室正面临定价压力测试。

行业 Coinbase GLM 5.2 Kimi 2.7 成本优化定价压力

推荐理由：Coinbase用GLM 5.2和Kimi 2.7替换了西方模型，成本砍半，缓存命中率翻了12倍。想知道为什么中国模型更便宜？

原文

6月27日

21:54

AK@_akhaliq

hf-claude 工具允许用户在 Claude Code 中切换超过100个开源模型，包括 GLM 5.2、MiniMax-M3 和 DeepSeek v4 Pro。这一集成扩展了 Claude Code 的模型选择范围，用户无需离开 Claude Code 即可利用不同开源模型的能力。该功能主要面向需要灵活使用多种模型的开发者。目前该工具已在 X 上获得 1895 次浏览。

AI产品 hf-claude Claude Code GLM 5.2 MiniMax-M3 开源模型

推荐理由：想在 Claude Code 里用别的模型？hf-claude 能直接集成 100+ 开源模型，包括 GLM 5.2 和 DeepSeek v4 Pro，很方便。

原文

14:24

Marc Andreessen@pmarca

匿名AI研究员FleetingBits剖析了中国AI实验室格局：Zhipu类似Palantir，通过国企合同获得国家支持，其GLM 5.2模型毛利率约40%。MiniMax主打陪伴App Talky和视频生成App Hailuo，多数收入来自海外（含美国）。字节跳动的Doubao是中国最流行的AI应用，但不开源模型。

行业 Zhipu GLM 5.2 MiniMax ByteDance Doubao AI生态

推荐理由：别只盯着DeepSeek了。Zhipu毛利率40%靠国企单子，MiniMax用Talky和Hailuo出海赚美国人钱，字节Doubao闷声发大财——这篇把中国AI家底都抖出来了。

原文

13:04

orange.ai@oran_ge

oran_ge基于Cola的token消耗统计发现，GLM 5.2正在取代Claude Sonnet和Opus，成为付费用户最爱的模型。DeepSeek v4 Pro依然是大众用户中最受欢迎的模型，而GPT 5.5虽然强大但几乎无人使用。这一数据同时反映了Cola与Codex用户（GPT 5.5受众）画像是完全不同的。

行业 GLM 5.2 DeepSeek v4 Pro GPT 5.5 模型趋势用户偏好

推荐理由：oran_ge用Cola数据发现一个反常识现象：GLM 5.2在抢Claude的付费用户，而GPT 5.5却没人用，值得看看

原文

12:17

Harrison Chase@hwchase17

Coinbase CEO Brian Armstrong在推文中介绍了公司通过更优默认设置、智能路由和缓存来控制AI支出增长。他们默认使用开源模型如GLM 5.2和Kimi 2.7，使91%员工未触发使用上限。缓存命中率在LibreChat中从5%提升至60%。这些措施使AI支出降低近一半，同时token使用量持续增长。

技巧成本优化缓存 Coinbase GLM 5.2 Kimi 2.7

推荐理由：Coinbase用缓存和默认模型省了一半钱，还让token随便用，想省成本的团队可以照抄作业。

原文

6月26日

11:57

歸藏(guizang.ai)@op7418

OpenAI模型需经美国政府逐一审核B端客户后方可上线。Anthropic指控中国公司蒸馏其模型。GLM 5.2等事件显示模型发布已类同军民两用战略资产。发布节奏将放缓，准入门槛提高。美国模型公司护城河转向安全合规交付能力。

行业 OpenAI Anthropic GLM 5.2 美国政府模型监管

推荐理由：AI模型发布现在要过美国政府审核了，OpenAI和Anthropic的后续动向都会受影响，国内开源模型可能借机上位。

原文

02:56

AK@_akhaliq

开发者使用GLM 5.2模型在hf-claude环境下，为9B参数的Ornith-1.0-9B模型搭建了一个Gradio服务器应用。该推文获得3条回复和3197次浏览。应用通过Gradio界面提供交互式推理，可直接测试模型的文本生成能力。代码可能开源，用户可自行部署。

技巧 GLM 5.2 hf-claude Ornith-1.0-9B Gradio 模型部署

推荐理由：有人用GLM 5.2和hf-claude给Ornith-1.0-9B做了个Gradio界面，直接就能上手试，省了写前端代码的功夫。

原文

6月25日

08:24

AK@_akhaliq

用户使用 GLM 5.2 模型在 hf-claude 框架下，为图像生成模型 krea-2-turbo 构建了一个 Gradio 交互界面。该工作流允许通过 Gradio 直接调用 krea-2-turbo 进行图像生成，无需复杂命令行操作。演示视频显示界面支持实时参数调整，如步数、引导尺度等。目前该项目已在 GitHub 上开源，提供了完整的代码和部署说明。

技巧 GLM 5.2 hf-claude krea-2-turbo Gradio 工作流

推荐理由：教你用 GLM 5.2 + hf-claude 给 krea-2-turbo 搭个 Gradio 界面，省去命令行繁琐，上手即用。

原文

07:59

Fireworks AI@FireworksAI_HQ

Fireworks AI 与 Cursor 合作，让用户在 Cursor 中即可切换至最新的开源前沿模型 GLM 5.2，无需更换编程工具。该模型在多项评估中获得提升，具体基准成绩见原文链接。这意味着开发者可以轻松尝试 GLM 5.2 的代码能力，而无需离开日常使用的 AI 编程助手。

AI模型 GLM 5.2 Cursor Fireworks AI 开源模型编程助手

推荐理由：Fireworks 和 Cursor 联手，让你直接在 Cursor 里换用最新的 GLM 5.2 模型，省去切换工具的麻烦。

原文

05:58

Fireworks AI@FireworksAI_HQ

Fireworks AI 宣布其平台现支持对开源编码模型 GLM 5.2 进行微调，涵盖 SFT、DPO 和 RL 三种方法。GLM 5.2 在多个编码基准上表现强势，但 Fireworks 指出排行榜赢家未必适合你的代码库，微调可缩小差距。训练后的模型可直接在同一生产栈上提供服务，无需切换或迁移。早期客户反馈热烈，目前开放私测申请。

AI产品 GLM 5.2 Fireworks SFT DPO 微调

推荐理由：想用最强开源编码模型但通用版不顺手？Fireworks 让你微调 GLM 5.2，SFT/DPO/RL 全包，训练完直接上线，不用折腾。

原文

05:27

Fireworks AI@FireworksAI_HQ

精选

Fireworks AI 宣布攻克了在前沿模型上使用强化学习时，保持训练和推理数值完全一致（零KLD）的难题。他们将该解决方案作为托管服务提供，首发支持 GLM 5.2 模型。这项服务确保端到端数值对齐，简化了RL训练流程。

AI产品 Fireworks AI GLM 5.2 强化学习推理优化

推荐理由：Fireworks AI 把强化学习里最头疼的数值一致性问题搞定了，还能直接托管GLM 5.2，省去自己搭基础设施的麻烦。

原文

6月24日

09:24

AK@_akhaliq

hf-claude 扩展已确认与 GLM 5.2 版本兼容。用户可通过命令“hf extensions install hf-claude”安装该扩展。该扩展为 Hugging Face 生态提供了 Claude 模型的集成支持，让用户能在 GLM 5.2 环境中更稳定地使用 Claude 相关功能。

技巧 hf-claude GLM 5.2 Hugging Face 扩展

推荐理由：用 GLM 5.2 的话，装这个扩展就能跑 Claude，挺方便的。

原文

06:03

OpenRouter@OpenRouterAI

OpenRouter 宣布提供 GLM 5.2 模型的所有服务商入口，共列出 20 个提供商。其中一条服务线路的推理速度超过 125 tokens/秒。用户可在单一页面比较并选择不同服务商。这标志着 GLM 5.2 的部署生态进一步开放。

AI模型 GLM 5.2 OpenRouter 开源模型推理模型高速推理

推荐理由：想用 GLM 5.2 但不清楚哪家快？OpenRouter 把 20 个提供商列在一起了，还能直接选超 125 TPS 的那条线。

原文

02:54

Y Combinator@ycombinator

Linzumi AI 发布新功能，允许团队将数十个 AI 编程代理放入同一聊天线程，由 Linzumi AI 自动协调。该功能旨在提升多代理协作效率。同时，通过与 Wafer AI 的合作，限时免费提供开源权重模型 GLM 5.2 的高速访问。GLM 5.2 被描述为 state of the art 的开放权重模型。

AI产品 Linzumi AI GLM 5.2 Wafer AI 编程助手团队协作

推荐理由：Linzumi AI 这个新功能挺有意思，能让你们团队和几十个AI代理在一个聊天里干活，还有免费的GLM 5.2 高速版可以用，试试看。

原文

6月23日

14:03

OpenRouter@OpenRouterAI

GLM 5.2 自发布以来在 OpenRouter 平台上的 token 消耗占比迅速上升，与早先发布的 DeepSeek V4 形成竞争。OpenRouter 数据显示，GLM 5.2 的开源模型采纳速度超过多数同类产品。目前两者在 token 份额上差距缩小，但 DeepSeek V4 仍占一定优势。

行业 GLM 5.2 DeepSeek V4 OpenRouter 开源模型 token份额

推荐理由：OpenRouter晒出了GLM 5.2和DeepSeek V4的token份额对比，GLM 5.2涨得真快，开源模型里能跟DeepSeek掰手腕了。

原文

02:26

LangChain@LangChainAI

LangChain 宣布其通用开发者工具 dcode 现已支持 GLM 5.2 模型。用户可直接在 dcode 中运行该开源模型，无需额外配置。dcode 是提供商无关的工具，也兼容其他最新的开源模型。详情可查阅 LangChain 文档。

AI模型 GLM 5.2 dcode LangChain 开源模型

推荐理由：LangChain 出了个叫 dcode 的工具，现在能跑 GLM 5.2 模型了，而且是开源的，想尝鲜直接上手。

原文

6月21日

03:53

Browser Use@browser_use

GLM 5.2（纯文本模型）在网站设计任务中击败了 Fable 5。团队将 GLM 5.2 与 Browser Use v2 多模态 QA 子代理配对，让代理审查网站、发现 bug、判断美学，再向 GLM 发送修复指令。整个构建加质量保证的成本低于 0.75 美元。展示了纯文本模型通过智能协作在视觉任务上的潜力。

技巧 GLM 5.2 Browser Use v2 Fable 5 多模态智能体

推荐理由：GLM 5.2 纯文本模型竟然能设计网站，还打败了 Fable 5？搭配 Browser Use v2 多模态 QA 代理，成本不到 0.75 美元，太会玩了。

原文

6月20日

16:46

Pandaily@contact@pandaily.com (Pandaily)

智谱AI的GLM 5.2在Design Arena的HTML网页设计基准测试中超越Claude Fable 5，获得第一名。该模型在第三方库利用方面表现更优，同时具备成本优势。Design Arena基准专门评估AI生成HTML代码的设计质量和功能性。

AI模型 GLM 5.2 Claude Fable 5 Zhipu AI Design Arena 网页设计

推荐理由：智谱AI的GLM 5.2在网页设计上干掉了Claude Fable 5，库支持更好还更省钱。

原文

10:54

shao__meng@shao__meng

GLM 5.2 开源后在 X 平台获得多位国外 AI 博主称赞。智谱港股股价近期飙升，市值已超过 MiniMax 并接近小米。作者提到智谱内部运营问题和自身充值体验，但认为模型够强仍是核心。

AI模型 GLM 5.2 智谱开源模型港股

推荐理由：智谱开源了 GLM 5.2，国外博主都在夸，股价还涨到快赶上小米了，模型实力真的能打。

原文

05:55

Browser Use@browser_use

GLM 5.2 在 BrowserCode 基准上达到接近 Opus 级别分数，单次任务成本仅 0.18 美元。Minimax M3 取得 Sonnet 级别分数，输入价格 0.30 美元，比 DeepSeek V4 Pro 更便宜。Kimi k2.7 相比 k2.6 提升 9%，但被 M3 超越。这些开源权重模型首次在浏览器智能体任务中追平甚至超过 GPT 5.5 等闭源模型。

AI模型 GLM 5.2 Minimax M3 Kimi k2.7 BrowserCode 智能体

推荐理由：智谱发了 GLM 5.2，Benchmark 接近 Opus，成本才一毛八，还有更便宜的 M3 和升级的 Kimi 2.7，做浏览器智能体有得选了。

原文

05:54

Browser Use@browser_use

精选

GLM 5.2 模型现已可在 BrowserCode 中直接运行，BrowserCode 是一个开源的浏览器代理框架（GitHub 仓库 browser-use/browser-code）。用户可通过该框架在真实浏览器环境中调用 GLM 5.2 完成网页操控任务。目前该功能已上线，开发者可试用。

AI产品 GLM 5.2 BrowserCode 浏览器自动化智能体

推荐理由：想用 GLM 5.2 做浏览器自动化？现在 BrowserCode 可以直接跑，省去自己搭环境的麻烦。

原文

6月19日

12:42

Fireworks AI@FireworksAI_HQ

Jeremy Howard在X平台上称赞Zai_org的GLM 5.2模型，称其至少与Opus 4.8和GPT 5.5一样优秀。他指出该模型速度极快、成本低廉且回答不冗长，在处理长上下文时表现非常出色。Howard表示从未见过如此优秀的开源权重模型。

AI模型 GLM 5.2 Zai_org Opus 4.8 GPT 5.5 开源模型

推荐理由：想试试媲美顶级闭源模型的开源模型吗？GLM 5.2又快又便宜，长上下文超强，看看Jeremy Howard怎么夸的。

原文

01:33

SiliconFlowAI@siliconflowai

精选

Z.ai 的 GLM 5.2 在编码基准 CodeArena 上排名第一。每百万 token 输入缓存/输入/输出价格为 0.26/1.40/4.40 美元，支持 1M 上下文长度。其编码性能与 Opus 4.8 相当，并提供 max 和 high 两种推理模式。该模型已完全开源，可通过 SiliconFlow 的 T+0 合作获取。

AI模型 GLM 5.2 Z.ai CodeArena SiliconFlow 开源模型

推荐理由：Z.ai 的 GLM 5.2 在编码竞技场拿了第一，价格比 Opus 便宜，还有 1M 上下文，编程党可以白嫖开源版。

原文

6月18日

20:22

vLLM@vllm_project

精选

vLLM 推出新功能，允许用户在自己的 GPU 上运行开源模型作为编程助手。该引擎兼容 OpenAI Responses API，因此任何使用代码助手的工具都可直接指向你的服务器。支持 NVIDIA、AMD 等多种硬件。当前可部署 GLM 5.2、Kimi K2.7 Code、MiniMax M3 等模型。

AI产品 vLLM 编程助手开源模型 GLM 5.2 Kimi K2.7 Code

推荐理由：vLLM 现在能让你自己在 GPU 上跑开源模型当编程助手，省了 API 钱还更灵活，支持 NVIDIA、AMD 和多种模型。

原文

05:29

ollama@ollama

用户称 GLM 5.2 达到 SOTA 级别的智能，但成本仅为同类模型的一小部分。他认为 GLM 5.2 的输出和个性优于 GPT 5.5。他计划将 GLM 5.2 用于自己的工具 Hermes 以及客户项目中。该推文获得 170 点赞和超 7300 次浏览。

AI模型 GLM 5.2 GPT 5.5 Hermes 开源模型

推荐理由：有人实测后说 GLM 5.2 比 GPT 5.5 更强还便宜，准备放进自己产品用，有参考价值。

原文

6月17日

23:32

Guillermo Rauch@rauchg

Vercel CEO指出，在模型竞争加剧的当下，ai-sdk比以往更重要。开源模型GLM 5.2在Next.js Evals中击败了Opus 4.8。同时Vercel推出eve.dev，提供构建和部署智能体的实用解决方案，类比React与Next.js的关系。

AI产品 GLM 5.2 Opus 4.8 Next.js eve.dev 智能体

推荐理由：Vercel发了eve.dev，帮你快速搞Agent；还有GLM 5.2在Next.js评测里赢了Opus 4.8，开源再进一步。

原文

13:43

orange.ai@oran_ge

精选76°

智谱 AI 今日正式开源 GLM 5.2 模型。该模型在编程 coding 能力上达到与 Claude 3 Opus 相当的水平，是首个实现这一成就的开源模型。GLM 5.2 已作为 beta 模型接入 Cola 平台供用户测试，定价与官方版本相同。

AI模型 GLM 5.2 智谱AI Cola 编程助手开源模型

推荐理由：智谱把编程能力比肩 Opus 的 GLM 5.2 开源了，还接入了 Cola 让大家免费试。

原文

10:00

Fireworks AI@FireworksAI_HQ

精选

Fireworks AI 宣布支持 GLM 5.2 模型，直接运行模型权重而非通过路由转发到其他平台。他们承诺零数据保留、生产级延迟，并开放 1M 上下文窗口。该服务面向长时编码代理，强调稳定性而非基准排名。

AI产品 GLM 5.2 Fireworks AI 推理模型上下文窗口编码代理

推荐理由：Fireworks 直接跑 GLM 5.2 权重，1M 上下文还不存你的数据，做编码代理很稳。

原文

09:34

Fireworks AI@FireworksAI_HQ

精选71°

GLM 5.2 已在 Fireworks 平台零日上线。该模型拥有 1M token 上下文窗口，定位为编码优先的前沿模型。其性能在 SWE-bench、Terminal-Bench、GPQA 和 AIME 等基准上得到独立验证。Fireworks 在智谱开源模型权重后立即在其基础设施上提供服务。

AI模型 GLM 5.2 Fireworks 智谱推理模型编程助手

推荐理由：Fireworks 第一时间上线了 GLM 5.2，百万 token 上下文很能打，编程基准表现不错，做开发的可以试试。

原文

04:34

Notion@NotionHQ

Notion 宣布在其平台上推出开放权重模型 GLM 5.2。该模型专门为长周期任务优化，通过 Baseten 提供服务。用户可直接在 Notion 中使用该模型，其权重公开可用于自定义部署。

AI模型 GLM 5.2 Notion Baseten 开放权重模型

推荐理由：Notion 上多了个新模型 GLM 5.2，专搞长周期任务，通过 Baseten 提供服务，想试试开放权重模型的可以看看。

原文

04:01

elvis@omarsar0

GLM 5.2 在 FrontierSWE 基准上排名第 3，得分仅次于 Fable 5 和 Opus 4.8，并超越 GPT-5.5。这是首个缩小 Anthropic/OpenAI 与其他提供商之间差距的模型，同时也是目前最强的开源权重模型。该成绩展示了开源模型在编码任务上的竞争力。

AI模型 GLM 5.2 FrontierSWE GPT-5.5 开源模型编码基准

推荐理由：GLM 5.2 在编码基准上干掉了 GPT-5.5，开源里最强，值得关注。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月13日

17:52

orange.ai@oran_ge

Fable 5 模型因美国政府以国家安全为由要求 Anthropic 下架，已从全球范围移除。Kimi 发布开源 coding 模型 K2.7 Code，相比 K2.6 提升 20% 编码能力，思考 token 减少 30%，API 输入 6.5 元、输出 27 元。智谱宣布即将发布 GLM 5.2，强调前沿智能应开放可用。

行业 Fable 5 Anthropic Kimi K2.7 Code GLM 5.2 开源模型

推荐理由：Fable 5 下架，Kimi 和智谱发新模型

原文

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？