14:21AI Will@FinanceYF5用户将Opus 4.8替换为Kimi K2.7进行推理任务,基准差距约8%,价格便宜11倍。代码生成从GPT-5.5替换为Qwen 3.7 Max,基准差距约18%,价格便宜7倍。智能体循环与工具调用从Sonnet 4.7替换为GLM 5.2,基准差距约3%,输入价格便宜5倍。图像生成从GPT-Image-2替换为Wan 2.5,基准差距约5%,价格便宜8倍;视频生成从Sora 2替换为Kling 3.0,差距大致相等,价格便宜6倍。30天后运营成本下降87%,输出质量平均下降4%,收入不变,且模型可本地运行、保障数据安全。技巧Kimi K2.7Qwen 3.7 MaxGLM 5.2Kling 3.0成本对比1 个信源在谈推荐理由:他把Opus、GPT、Sonnet全换成中国模型:成本降87%,性能只降4%,收入不变。附完整迁移方法。原文
08:44SuperTechFans(博客/媒体)78°Semgrep 安全团队对比多模型在 IDOR 漏洞检测上的表现,GLM 5.2 在仅给定提示下取得 39% F1,高于 Claude Code 的 32% 和 Claude Opus 4.8。该模型是智谱 AI 开源的 750B 总参数 MoE 模型,每个 token 仅激活 40B,支持 128K 上下文,采用 MIT 许可证。专业静态分析管道 Semgrep 多模态仍领先,F1 达 53%–61%,显示模型与框架的差距。AI模型GLM 5.2ClaudeSemgrep智谱 AIIDOR检测1 个信源在谈推荐理由:智谱的 GLM 5.2 开源模型在安全漏洞检测上居然超过了 Claude,而且推理成本低,适合做代码审计。原文
17:45Browser Use@browser_useBrowser Use 团队使用 v4 版本构建 QA 基准测试,将 GLM 5.2、Opus 4.7、GPT 5.5 和 Minimax M3 四个模型在 LLM Arena 数据集上的任务进行对比。每个模型生成网站后由人工评估打分,测试涵盖多个任务类型。结果揭示了开源权重模型在特定场景下的表现差异。AI模型GLM 5.2Opus 4.7GPT 5.5Minimax M3基准测试3 个信源在谈推荐理由:他们用 Browser Use v4 搞了个新基准,测了 GLM 5.2、Opus 4.7、GPT 5.5 和 Minimax M3,人工打分告诉你谁在 QA 任务上更强。原文
11:51Browser Use@browser_useBrowser Use 团队对 Opus 4.7 和 GLM 5.2 进行前端设计基准测试。测试使用 Browser Use v4 工具,从 LLM Arena 数据集中选取一个 prompt。每个模型根据该 prompt 生成网站并自动评分。结果对比了这两款模型在代码生成和界面设计上的能力。AI模型Opus 4.7GLM 5.2Browser UseLLM Arena前端生成推荐理由:Browser Use 团队拿 Opus 4.7 和 GLM 5.2 比前端设计,一个 prompt 生成网站打分,看看谁画页面更强。原文
00:01Clement Delangue@ClementDelangueBrian Armstrong在推文中分享了Coinbase控制AI成本的实践。他提到,通过将默认模型切换到开源模型如GLM 5.2和Kimi 2.7,91%的员工从未触及使用上限。通过改进缓存,LibreChat的缓存命中率从5%提升到60%。这些措施使AI支出减少近一半,同时token用量仍在增长。他还强调路由优化和精简上下文的重要性。技巧Hugging FaceGLM 5.2Kimi 2.7成本优化缓存推荐理由:Coinbase创始人Brian Armstrong分享了一套实际操作方案:用更便宜的默认模型、优化缓存和路由,能把AI成本砍半。开源模型GLM 5.2和Kimi 2.7是主角,缓存命中率从5%跳到60%。原文
20:24Decoder@Matthias Bastian精选Coinbase CEO Brian Armstrong将公司系统切换至中国AI模型GLM 5.2和Kimi 2.7。自动路由系统根据任务和价格选择最佳模型,缓存命中率从5%提升至60%。尽管token使用量持续增长,Coinbase的AI支出已减半。此举凸显西方AI实验室正面临定价压力测试。行业CoinbaseGLM 5.2Kimi 2.7成本优化定价压力推荐理由:Coinbase用GLM 5.2和Kimi 2.7替换了西方模型,成本砍半,缓存命中率翻了12倍。想知道为什么中国模型更便宜?原文
21:54AK@_akhaliqhf-claude 工具允许用户在 Claude Code 中切换超过100个开源模型,包括 GLM 5.2、MiniMax-M3 和 DeepSeek v4 Pro。这一集成扩展了 Claude Code 的模型选择范围,用户无需离开 Claude Code 即可利用不同开源模型的能力。该功能主要面向需要灵活使用多种模型的开发者。目前该工具已在 X 上获得 1895 次浏览。AI产品hf-claudeClaude CodeGLM 5.2MiniMax-M3开源模型4 个信源在谈推荐理由:想在 Claude Code 里用别的模型?hf-claude 能直接集成 100+ 开源模型,包括 GLM 5.2 和 DeepSeek v4 Pro,很方便。原文
14:24Marc Andreessen@pmarca匿名AI研究员FleetingBits剖析了中国AI实验室格局:Zhipu类似Palantir,通过国企合同获得国家支持,其GLM 5.2模型毛利率约40%。MiniMax主打陪伴App Talky和视频生成App Hailuo,多数收入来自海外(含美国)。字节跳动的Doubao是中国最流行的AI应用,但不开源模型。行业ZhipuGLM 5.2MiniMaxByteDanceDoubaoAI生态2 个信源在谈推荐理由:别只盯着DeepSeek了。Zhipu毛利率40%靠国企单子,MiniMax用Talky和Hailuo出海赚美国人钱,字节Doubao闷声发大财——这篇把中国AI家底都抖出来了。原文
13:04orange.ai@oran_georan_ge基于Cola的token消耗统计发现,GLM 5.2正在取代Claude Sonnet和Opus,成为付费用户最爱的模型。DeepSeek v4 Pro依然是大众用户中最受欢迎的模型,而GPT 5.5虽然强大但几乎无人使用。这一数据同时反映了Cola与Codex用户(GPT 5.5受众)画像是完全不同的。行业GLM 5.2DeepSeek v4 ProGPT 5.5模型趋势用户偏好1 个信源在谈推荐理由:oran_ge用Cola数据发现一个反常识现象:GLM 5.2在抢Claude的付费用户,而GPT 5.5却没人用,值得看看原文
12:17Harrison Chase@hwchase17Coinbase CEO Brian Armstrong在推文中介绍了公司通过更优默认设置、智能路由和缓存来控制AI支出增长。他们默认使用开源模型如GLM 5.2和Kimi 2.7,使91%员工未触发使用上限。缓存命中率在LibreChat中从5%提升至60%。这些措施使AI支出降低近一半,同时token使用量持续增长。技巧成本优化缓存CoinbaseGLM 5.2Kimi 2.7推荐理由:Coinbase用缓存和默认模型省了一半钱,还让token随便用,想省成本的团队可以照抄作业。原文
11:57歸藏(guizang.ai)@op7418OpenAI模型需经美国政府逐一审核B端客户后方可上线。Anthropic指控中国公司蒸馏其模型。GLM 5.2等事件显示模型发布已类同军民两用战略资产。发布节奏将放缓,准入门槛提高。美国模型公司护城河转向安全合规交付能力。行业OpenAIAnthropicGLM 5.2美国政府模型监管10 个信源在谈推荐理由:AI模型发布现在要过美国政府审核了,OpenAI和Anthropic的后续动向都会受影响,国内开源模型可能借机上位。原文
02:56AK@_akhaliq开发者使用GLM 5.2模型在hf-claude环境下,为9B参数的Ornith-1.0-9B模型搭建了一个Gradio服务器应用。该推文获得3条回复和3197次浏览。应用通过Gradio界面提供交互式推理,可直接测试模型的文本生成能力。代码可能开源,用户可自行部署。技巧GLM 5.2hf-claudeOrnith-1.0-9BGradio模型部署推荐理由:有人用GLM 5.2和hf-claude给Ornith-1.0-9B做了个Gradio界面,直接就能上手试,省了写前端代码的功夫。原文
08:24AK@_akhaliq用户使用 GLM 5.2 模型在 hf-claude 框架下,为图像生成模型 krea-2-turbo 构建了一个 Gradio 交互界面。该工作流允许通过 Gradio 直接调用 krea-2-turbo 进行图像生成,无需复杂命令行操作。演示视频显示界面支持实时参数调整,如步数、引导尺度等。目前该项目已在 GitHub 上开源,提供了完整的代码和部署说明。技巧GLM 5.2hf-claudekrea-2-turboGradio工作流推荐理由:教你用 GLM 5.2 + hf-claude 给 krea-2-turbo 搭个 Gradio 界面,省去命令行繁琐,上手即用。原文
07:59Fireworks AI@FireworksAI_HQFireworks AI 与 Cursor 合作,让用户在 Cursor 中即可切换至最新的开源前沿模型 GLM 5.2,无需更换编程工具。该模型在多项评估中获得提升,具体基准成绩见原文链接。这意味着开发者可以轻松尝试 GLM 5.2 的代码能力,而无需离开日常使用的 AI 编程助手。AI模型GLM 5.2CursorFireworks AI开源模型编程助手6 个信源在谈推荐理由:Fireworks 和 Cursor 联手,让你直接在 Cursor 里换用最新的 GLM 5.2 模型,省去切换工具的麻烦。原文
05:58Fireworks AI@FireworksAI_HQFireworks AI 宣布其平台现支持对开源编码模型 GLM 5.2 进行微调,涵盖 SFT、DPO 和 RL 三种方法。GLM 5.2 在多个编码基准上表现强势,但 Fireworks 指出排行榜赢家未必适合你的代码库,微调可缩小差距。训练后的模型可直接在同一生产栈上提供服务,无需切换或迁移。早期客户反馈热烈,目前开放私测申请。AI产品GLM 5.2FireworksSFTDPO微调推荐理由:想用最强开源编码模型但通用版不顺手?Fireworks 让你微调 GLM 5.2,SFT/DPO/RL 全包,训练完直接上线,不用折腾。原文
05:27Fireworks AI@FireworksAI_HQ精选Fireworks AI 宣布攻克了在前沿模型上使用强化学习时,保持训练和推理数值完全一致(零KLD)的难题。他们将该解决方案作为托管服务提供,首发支持 GLM 5.2 模型。这项服务确保端到端数值对齐,简化了RL训练流程。AI产品Fireworks AIGLM 5.2强化学习推理优化推荐理由:Fireworks AI 把强化学习里最头疼的数值一致性问题搞定了,还能直接托管GLM 5.2,省去自己搭基础设施的麻烦。原文
09:24AK@_akhaliqhf-claude 扩展已确认与 GLM 5.2 版本兼容。用户可通过命令“hf extensions install hf-claude”安装该扩展。该扩展为 Hugging Face 生态提供了 Claude 模型的集成支持,让用户能在 GLM 5.2 环境中更稳定地使用 Claude 相关功能。技巧hf-claudeGLM 5.2Hugging Face扩展推荐理由:用 GLM 5.2 的话,装这个扩展就能跑 Claude,挺方便的。原文
06:03OpenRouter@OpenRouterAIOpenRouter 宣布提供 GLM 5.2 模型的所有服务商入口,共列出 20 个提供商。其中一条服务线路的推理速度超过 125 tokens/秒。用户可在单一页面比较并选择不同服务商。这标志着 GLM 5.2 的部署生态进一步开放。AI模型GLM 5.2OpenRouter开源模型推理模型高速推理推荐理由:想用 GLM 5.2 但不清楚哪家快?OpenRouter 把 20 个提供商列在一起了,还能直接选超 125 TPS 的那条线。原文
02:54Y Combinator@ycombinatorLinzumi AI 发布新功能,允许团队将数十个 AI 编程代理放入同一聊天线程,由 Linzumi AI 自动协调。该功能旨在提升多代理协作效率。同时,通过与 Wafer AI 的合作,限时免费提供开源权重模型 GLM 5.2 的高速访问。GLM 5.2 被描述为 state of the art 的开放权重模型。AI产品Linzumi AIGLM 5.2Wafer AI编程助手团队协作推荐理由:Linzumi AI 这个新功能挺有意思,能让你们团队和几十个AI代理在一个聊天里干活,还有免费的GLM 5.2 高速版可以用,试试看。原文
14:03OpenRouter@OpenRouterAIGLM 5.2 自发布以来在 OpenRouter 平台上的 token 消耗占比迅速上升,与早先发布的 DeepSeek V4 形成竞争。OpenRouter 数据显示,GLM 5.2 的开源模型采纳速度超过多数同类产品。目前两者在 token 份额上差距缩小,但 DeepSeek V4 仍占一定优势。行业GLM 5.2DeepSeek V4OpenRouter开源模型token份额推荐理由:OpenRouter晒出了GLM 5.2和DeepSeek V4的token份额对比,GLM 5.2涨得真快,开源模型里能跟DeepSeek掰手腕了。原文
02:26LangChain@LangChainAILangChain 宣布其通用开发者工具 dcode 现已支持 GLM 5.2 模型。用户可直接在 dcode 中运行该开源模型,无需额外配置。dcode 是提供商无关的工具,也兼容其他最新的开源模型。详情可查阅 LangChain 文档。AI模型GLM 5.2dcodeLangChain开源模型推荐理由:LangChain 出了个叫 dcode 的工具,现在能跑 GLM 5.2 模型了,而且是开源的,想尝鲜直接上手。原文
03:53Browser Use@browser_useGLM 5.2(纯文本模型)在网站设计任务中击败了 Fable 5。团队将 GLM 5.2 与 Browser Use v2 多模态 QA 子代理配对,让代理审查网站、发现 bug、判断美学,再向 GLM 发送修复指令。整个构建加质量保证的成本低于 0.75 美元。展示了纯文本模型通过智能协作在视觉任务上的潜力。技巧GLM 5.2Browser Use v2Fable 5多模态智能体2 个信源在谈推荐理由:GLM 5.2 纯文本模型竟然能设计网站,还打败了 Fable 5?搭配 Browser Use v2 多模态 QA 代理,成本不到 0.75 美元,太会玩了。原文
16:46Pandaily@contact@pandaily.com (Pandaily)智谱AI的GLM 5.2在Design Arena的HTML网页设计基准测试中超越Claude Fable 5,获得第一名。该模型在第三方库利用方面表现更优,同时具备成本优势。Design Arena基准专门评估AI生成HTML代码的设计质量和功能性。AI模型GLM 5.2Claude Fable 5Zhipu AIDesign Arena网页设计7 个信源在谈推荐理由:智谱AI的GLM 5.2在网页设计上干掉了Claude Fable 5,库支持更好还更省钱。原文
10:54shao__meng@shao__mengGLM 5.2 开源后在 X 平台获得多位国外 AI 博主称赞。智谱港股股价近期飙升,市值已超过 MiniMax 并接近小米。作者提到智谱内部运营问题和自身充值体验,但认为模型够强仍是核心。AI模型GLM 5.2智谱开源模型港股推荐理由:智谱开源了 GLM 5.2,国外博主都在夸,股价还涨到快赶上小米了,模型实力真的能打。原文
05:55Browser Use@browser_useGLM 5.2 在 BrowserCode 基准上达到接近 Opus 级别分数,单次任务成本仅 0.18 美元。Minimax M3 取得 Sonnet 级别分数,输入价格 0.30 美元,比 DeepSeek V4 Pro 更便宜。Kimi k2.7 相比 k2.6 提升 9%,但被 M3 超越。这些开源权重模型首次在浏览器智能体任务中追平甚至超过 GPT 5.5 等闭源模型。AI模型GLM 5.2Minimax M3Kimi k2.7BrowserCode智能体2 个信源在谈推荐理由:智谱发了 GLM 5.2,Benchmark 接近 Opus,成本才一毛八,还有更便宜的 M3 和升级的 Kimi 2.7,做浏览器智能体有得选了。原文
05:54Browser Use@browser_use精选GLM 5.2 模型现已可在 BrowserCode 中直接运行,BrowserCode 是一个开源的浏览器代理框架(GitHub 仓库 browser-use/browser-code)。用户可通过该框架在真实浏览器环境中调用 GLM 5.2 完成网页操控任务。目前该功能已上线,开发者可试用。AI产品GLM 5.2BrowserCode浏览器自动化智能体推荐理由:想用 GLM 5.2 做浏览器自动化?现在 BrowserCode 可以直接跑,省去自己搭环境的麻烦。原文
12:42Fireworks AI@FireworksAI_HQJeremy Howard在X平台上称赞Zai_org的GLM 5.2模型,称其至少与Opus 4.8和GPT 5.5一样优秀。他指出该模型速度极快、成本低廉且回答不冗长,在处理长上下文时表现非常出色。Howard表示从未见过如此优秀的开源权重模型。AI模型GLM 5.2Zai_orgOpus 4.8GPT 5.5开源模型3 个信源在谈推荐理由:想试试媲美顶级闭源模型的开源模型吗?GLM 5.2又快又便宜,长上下文超强,看看Jeremy Howard怎么夸的。原文
01:33SiliconFlowAI@siliconflowai精选Z.ai 的 GLM 5.2 在编码基准 CodeArena 上排名第一。每百万 token 输入缓存/输入/输出价格为 0.26/1.40/4.40 美元,支持 1M 上下文长度。其编码性能与 Opus 4.8 相当,并提供 max 和 high 两种推理模式。该模型已完全开源,可通过 SiliconFlow 的 T+0 合作获取。AI模型GLM 5.2Z.aiCodeArenaSiliconFlow开源模型推荐理由:Z.ai 的 GLM 5.2 在编码竞技场拿了第一,价格比 Opus 便宜,还有 1M 上下文,编程党可以白嫖开源版。原文
20:22vLLM@vllm_project精选vLLM 推出新功能,允许用户在自己的 GPU 上运行开源模型作为编程助手。该引擎兼容 OpenAI Responses API,因此任何使用代码助手的工具都可直接指向你的服务器。支持 NVIDIA、AMD 等多种硬件。当前可部署 GLM 5.2、Kimi K2.7 Code、MiniMax M3 等模型。AI产品vLLM编程助手开源模型GLM 5.2Kimi K2.7 Code10 个信源在谈推荐理由:vLLM 现在能让你自己在 GPU 上跑开源模型当编程助手,省了 API 钱还更灵活,支持 NVIDIA、AMD 和多种模型。原文
05:29ollama@ollama用户称 GLM 5.2 达到 SOTA 级别的智能,但成本仅为同类模型的一小部分。他认为 GLM 5.2 的输出和个性优于 GPT 5.5。他计划将 GLM 5.2 用于自己的工具 Hermes 以及客户项目中。该推文获得 170 点赞和超 7300 次浏览。AI模型GLM 5.2GPT 5.5Hermes开源模型推荐理由:有人实测后说 GLM 5.2 比 GPT 5.5 更强还便宜,准备放进自己产品用,有参考价值。原文
23:32Guillermo Rauch@rauchgVercel CEO指出,在模型竞争加剧的当下,ai-sdk比以往更重要。开源模型GLM 5.2在Next.js Evals中击败了Opus 4.8。同时Vercel推出eve.dev,提供构建和部署智能体的实用解决方案,类比React与Next.js的关系。AI产品GLM 5.2Opus 4.8Next.jseve.dev智能体7 个信源在谈推荐理由:Vercel发了eve.dev,帮你快速搞Agent;还有GLM 5.2在Next.js评测里赢了Opus 4.8,开源再进一步。原文
13:43orange.ai@oran_ge精选76°智谱 AI 今日正式开源 GLM 5.2 模型。该模型在编程 coding 能力上达到与 Claude 3 Opus 相当的水平,是首个实现这一成就的开源模型。GLM 5.2 已作为 beta 模型接入 Cola 平台供用户测试,定价与官方版本相同。AI模型GLM 5.2智谱AICola编程助手开源模型1 个信源在谈推荐理由:智谱把编程能力比肩 Opus 的 GLM 5.2 开源了,还接入了 Cola 让大家免费试。原文
10:00Fireworks AI@FireworksAI_HQ精选Fireworks AI 宣布支持 GLM 5.2 模型,直接运行模型权重而非通过路由转发到其他平台。他们承诺零数据保留、生产级延迟,并开放 1M 上下文窗口。该服务面向长时编码代理,强调稳定性而非基准排名。AI产品GLM 5.2Fireworks AI推理模型上下文窗口编码代理推荐理由:Fireworks 直接跑 GLM 5.2 权重,1M 上下文还不存你的数据,做编码代理很稳。原文
09:34Fireworks AI@FireworksAI_HQ精选71°GLM 5.2 已在 Fireworks 平台零日上线。该模型拥有 1M token 上下文窗口,定位为编码优先的前沿模型。其性能在 SWE-bench、Terminal-Bench、GPQA 和 AIME 等基准上得到独立验证。Fireworks 在智谱开源模型权重后立即在其基础设施上提供服务。AI模型GLM 5.2Fireworks智谱推理模型编程助手1 个信源在谈推荐理由:Fireworks 第一时间上线了 GLM 5.2,百万 token 上下文很能打,编程基准表现不错,做开发的可以试试。原文
04:34Notion@NotionHQNotion 宣布在其平台上推出开放权重模型 GLM 5.2。该模型专门为长周期任务优化,通过 Baseten 提供服务。用户可直接在 Notion 中使用该模型,其权重公开可用于自定义部署。AI模型GLM 5.2NotionBaseten开放权重模型1 个信源在谈推荐理由:Notion 上多了个新模型 GLM 5.2,专搞长周期任务,通过 Baseten 提供服务,想试试开放权重模型的可以看看。原文
04:01elvis@omarsar0GLM 5.2 在 FrontierSWE 基准上排名第 3,得分仅次于 Fable 5 和 Opus 4.8,并超越 GPT-5.5。这是首个缩小 Anthropic/OpenAI 与其他提供商之间差距的模型,同时也是目前最强的开源权重模型。该成绩展示了开源模型在编码任务上的竞争力。AI模型GLM 5.2FrontierSWEGPT-5.5开源模型编码基准10 个信源在谈推荐理由:GLM 5.2 在编码基准上干掉了 GPT-5.5,开源里最强,值得关注。原文
17:52orange.ai@oran_geFable 5 模型因美国政府以国家安全为由要求 Anthropic 下架,已从全球范围移除。Kimi 发布开源 coding 模型 K2.7 Code,相比 K2.6 提升 20% 编码能力,思考 token 减少 30%,API 输入 6.5 元、输出 27 元。智谱宣布即将发布 GLM 5.2,强调前沿智能应开放可用。行业Fable 5AnthropicKimiK2.7 CodeGLM 5.2开源模型10 个信源在谈推荐理由:Fable 5 下架,Kimi 和智谱发新模型原文