03:06Matt Wolfe@mreflow83°Transformer共同发明人Noam Shazeer离开Google DeepMind,加入OpenAI。AlphaFold核心开发者John Jumper(因该成果获2024年诺贝尔化学奖)也选择离职,传闻去向是Anthropic。两人分别在不同领域做出里程碑式贡献,此次出走对Google DeepMind的研发实力造成显著冲击。事件凸显了当前顶尖AI人才争夺的白热化。行业Noam ShazeerJohn JumperGoogle DeepMindOpenAIAnthropicAI人才竞争10 个信源在谈推荐理由:OpenAI和Anthropic分别挖走Google DeepMind两位大佬,Transformer发明者和AlphaFold诺奖得主同时出走,人才战太激烈了。原文
03:05Together AI@togethercompute精选MiniMax-M3 模型支持智能体携带长历史(超过百万token)、图像、视频、文档和工具输出进入上下文,显著提升多模态信息处理能力。Together 的推理优化通过改进服务路径上的 token 吞吐量,使这一能力在大规模部署时更实用。相比之前方案,每 GPU 可处理更多 token,从而降低每美元自动化工作成本。AI模型MiniMax-M3Together智能体多模态推理优化2 个信源在谈推荐理由:MiniMax-M3 让智能体一口气带进长历史、图、视频、文档和工具输出,Together 优化后每 GPU token 翻倍,自动任务成本更低。原文
03:05Together AI@togethercompute88°OpenAI 的 GPT Image 2 模型现已在 Together AI 的 Serverless Inference 服务中上线。开发者可通过该接口将图像生成与编辑功能集成到多模态应用中。模型支持精准布局控制、可读文本生成以及参考图像引导生成。Together AI 提供无服务器推理能力,无需管理基础设施即可调用。AI模型GPT Image 2OpenAITogether AI图像生成多模态10 个信源在谈推荐理由:OpenAI 的新图像模型 GPT Image 2 现在能用 Together AI 的无服务器接口调用了,做多模态应用时直接用它生成和编辑图片,支持布局和文字控制,挺方便。原文
02:37Allen AI (Ai2)@allen_aiAI Squared 和 Domyn 两家公司利用 Allen AI 完全开源的 Olmo 语言模型系列,在金融、医疗和公共部门等受监管行业构建自定义模型。Olmo 模型提供完整开放性,允许企业根据行业法规进行合规微调和使用。该案例展示了开源模型在敏感领域实现私有化部署的具体路径。技巧OlmoAI SquaredDomynAllen AI开源模型推荐理由:金融医疗这种严监管行业,看看两家公司怎么直接拿开源模型Olmo改造成自己的,挺有参考价值。原文
02:27Stanford AI Lab@StanfordAILab斯坦福AI实验室的SAIL博客发布新文章,由Peter Bhase和Chris Potts共同撰写,系统梳理了CoT(思维链)监控作为AI安全热点问题的起源。文章回顾了相关研究的历史演进,分析了该概念如何从技术讨论演变为关键安全议题。论文SAILCoTChain-of-ThoughtAI安全推荐理由:斯坦福AI实验室的两位研究者梳理了CoT监控的来龙去脉,想理解AI安全前沿热点的演变,这篇博客值得看。原文
02:12Decoder@Matthias Bastian诺贝尔化学奖得主John Jumper在Google DeepMind工作近九年后,宣布加入Anthropic。此前,Gemini联合负责人Noam Shazeer已离开DeepMind加入OpenAI。AlphaGo研究员David Silver也在几周前离职创办自己的公司。三个月内,三位顶尖AI研究者接连离开DeepMind。行业John JumperAnthropicGoogle DeepMindNoam ShazeerAI人才流动10 个信源在谈推荐理由:又一位DeepMind大神跳槽了,John Jumper刚去Anthropic,加上Shazeer去OpenAI和Silver单干,核心人才在流失。原文
01:58Decoder@Matthias Bastian亚马逊MGM Studios取消了由Luca Guadagnino执导、Andrew Garfield主演的OpenAI题材电影“Artificial”。该片已接近完成,但亚马逊在2月与OpenAI签署了500亿美元合作协议后决定放弃。内部人士透露,电影中Sam Altman和Elon Musk的形象不佳。此事引发关于科技行业商业关系限制创作自由的讨论。行业AmazonOpenAISam Altman创作自由Andrew Garfield10 个信源在谈推荐理由:亚马逊因为跟OpenAI签了500亿美元大单,把一部快拍完的黑OpenAI电影给砍了,主演还是Andrew Garfield演奥特曼。原文
01:57Ate-a-Pi@svpinoLedger Nano Gen5是一款硬件签名器,可通过CLI和skills集成到AI代理项目。代理能查询以太坊账户、检查余额、发起交易,但所有操作都需人工用设备批准。私钥不存储在电脑或代理中,避免代价高昂的错误。整个流程只需两条命令:安装CLI和安装skills。技巧Ledger Nano Gen5CLIEthereum智能体AI安全推荐理由:用这个硬件,你的AI代理能干活但不敢乱花钱,所有操作都得你点头,私钥也不外传。原文
01:57Ate-a-Pi@svpino76°Atlassian 在 Jira UI 中新增了直接分配工单给 Claude Code 的功能。用户可从分配人下拉菜单选择“Claude”或在评论中提及。Claude 会获取工单全量上下文(包括验收标准、评论、附件等),然后克隆关联的 GitHub 仓库到沙箱中实现更改,并自动创建拉取请求。Jira 工单会同步更新 PR 链接。该集成需要 Anthropic API 密钥、GitHub 仓库和 Jira 账户。AI产品JiraClaude CodeAnthropicAtlassian智能体10 个信源在谈推荐理由:Jira 用户这下省心了,工单直接扔给 Claude,它自己读需求、改代码、提 PR,你只负责审核就行。原文
01:56Ate-a-Pi@svpino该博主从4月起在Mac Studio上运行gemma-4:26b处理私密文档,目前六成查询都使用该模型。它速度快且能力强,但复杂编程任务仍需专用模型。适合日常使用并避免向大型AI实验室上传数据。AI模型gemma-4:26b本地模型隐私文档Mac Studio推荐理由:gemma-4:26b 本地跑很香,处理私密文档不用传云端,日常六成查询够用。但写代码别指望它。原文
01:55宝玉@dotey精选Mitchell Hashimoto 在 AGENTS.md 文件和代码注释中嵌入 prompt injection。这些注入用于检测未审查代码就直接提交至另一位人类维护者的贡献者。一旦检测到,他会立即封禁该贡献者。他认为在开源项目中,跨越人类边界前进行人工审查是基本礼貌。行业prompt injectionAGENTS.mdMitchell Hashimoto开源项目AI安全推荐理由:Mitchell 这招挺狠,在项目文件里埋 prompt injection,谁不审代码直接提交就封号。搞开源维护的可以学学这招防饭圈。原文
01:48Greg Brockman@gdbOpenAI 与波士顿儿童医院合作,使用 o3 Deep Research 工具帮助诊断罕见遗传病。相关成果发表在《NEJM AI》期刊上。该工具通过分析全外显子组测序数据,协助医生识别致病基因变异。研究团队在视频中展示了具体诊断案例。论文OpenAIo3罕见遗传病AI诊断NEJM AI5 个信源在谈推荐理由:OpenAI 把 o3 模型用到罕见病诊断上,还发了 NEJM AI 论文,很实在的应用。原文
01:45GitHub Blog@Natalie GuevaraGitHub内部开发了名为Qubot的Copilot驱动数据分析智能体,允许员工用自然语言查询公司数据。团队分享了在构建过程中解决的关键技术挑战,包括如何将自然语言转化为SQL查询、处理复杂数据模型以及确保查询准确性。该智能体已部署在GitHub内部,支持超10个数据源。技巧QubotGitHubCopilot数据查询自然语言转SQL推荐理由:GitHub分享了他们用Copilot搭建内部数据分析工具Qubot的实战经验,从自然语言到SQL的难点和解决思路都有,适合想搞企业内部查询智能体的团队参考。原文
01:34@atomic_chat_hq@atomic_chat_hqKiloCode是一款被300万以上开发者使用的代码助手,现在可通过Atomic Chat在开源模型上本地运行。所有操作均在设备端完成,无需云端依赖,保证完全隐私。该服务免费且开源,支持代码编写、调试和构建。AI产品KiloCodeAtomic Chat开源模型编程助手本地AI推荐理由:KiloCode现在能直接用本地开源模型跑了,完全免费还保护隐私,3M+开发者都在用。原文
01:30Jerry Liu@jerryjliu0精选LiteParse v2.1是一个纯代码的Markdown文档解析器,不使用任何VLM或AI/OCR模型。在ParseBench基准上,它超越了Qwen 3.5-9B和GLM-OCR。但在密集视觉输出上仍落后于Gemma 4和PaddleOCR-VL。对于文字/表格密集的文档,差距显著缩小。它是目前最快且完全开源免费的解析器(Apache 2.0),支持CLI/Rust/Node/Python/WASM。AI产品LiteParse文档解析ParseBenchQwen 3.5-9B开源工具2 个信源在谈推荐理由:LiteParse v2.1用纯代码搞定Markdown解析,比很多VLM还准,文字表格多的文档尤其好用,速度飞快还免费开源,赶紧去试试。原文
00:55Milvus@milvusio精选Attu 3.0 beta 的 AI agent 能连接 50 多个 Milvus 工具,涵盖集合管理、数据操作、诊断和 RBAC。用户用自然语言描述需求,agent 自动调用对应工具执行,例如列出集合、创建带 schema 的集合、插入测试数据、运行向量搜索等。读操作直接返回结果,删除集合或修改权限等敏感操作会弹出确认对话框并显示参数。agent 支持本机部署,自带 OpenAI 兼容端点或 Gemini,所有调用记录(含工具名称、token 用量和失败信息)均可追溯。AI产品AttuMilvus智能体数据库自然语言操作10 个信源在谈推荐理由:Milvus 的 Attu 3.0 beta 让你用自然语言就能管理数据库,不只是问答,能直接执行操作,敏感操作还有二次确认,挺实用的。原文
00:54Y Combinator@ycombinatorBryant Chou(Webflow 联合创始人)正在当前 YC 批次中推出新项目 Ploy。Ploy 是一款 AI 网站和营销平台,能自动连接分析、CRM 和搜索控制台,在用户离线时优化营销。该平台声称可在 75 秒内重建整个网站,并强调“反垃圾”设计引擎。它旨在让网站成为公司的“大脑”,统一数据与增长策略。AI产品WebflowPloyYCAI网站平台AI营销推荐理由:Bryant Chou 做了 Webflow 后又回来了,这次 Ploy 能帮你边睡边优化网站和营销,75秒重建一个站,真挺实用的。原文
00:23IT之家(博客/媒体)谷歌在搜索结果中强行加入AI概览,当用户搜索“no AI”等短语时,AI概览建议用户前往DuckDuckGo的“No AI Search”页面。自2026年Google I/O大会以来,谷歌扩展AI模式,但用户反感情绪明显。DuckDuckGo透露,其美国区应用安装量平均周环比增长18.1%,峰值超30%。DuckDuckGo提供可关闭的AI功能,与谷歌形成对比。行业谷歌DuckDuckGoAI概览AI搜索推荐理由:谷歌AI概览居然把讨厌AI的用户推向对手DuckDuckGo,结果DuckDuckGo安装量暴涨30%,这个乌龙太有意思了。原文
23:57Thomas Wolf@Thom_Wolf开源模型生态欢迎新手尝试Opus 4.8级别的模型。GLM-5.2是ZAI org发布的开放权重模型,可通过Hugging Face页面使用。多个供应商竞争价格,智能体价格便宜。模型可本地运行、微调并构建商业应用,无需许可。HuggingChat提供免费聊天界面。AI模型GLM-5.2Hugging Face开源模型本地部署微调推荐理由:GLM-5.2达到Opus 4.8水平,免费、可本地跑、可微调,比闭源灵活还便宜,快试试!原文
23:54elvis@omarsar0精选论文提出三阶段流水线,从GUI轨迹中分段、聚类候选技能并训练技能感知策略。八个聚类中五个纯度≥0.95。但GRPO仅将技能步准确率从18.5%提升至20.5%,低于频率先验。作者指出弱边界检测器、无序段表示和离线奖励模型是三大原因。论文SKILL.mdCodexOpenAI智能体GRPO10 个信源在谈推荐理由:这篇论文用OpenAI Codex的思路做智能体技能提取,八个聚类五个纯度超0.95,但GRPO只提了2个点,分析很实在。原文
23:42IT之家(博客/媒体)信实工业在年度股东大会上发布AI通话助手Jio Call Agent,可自动转录对话、生成摘要并帮助叫车和点餐,预计今年晚些时候上线,覆盖超过5亿用户。同时推出AI版MyJio,用户通过自然语言指令即可完成开通eSIM、选择漫游套餐等操作。另一款新品TeleFrame面向智能家居,利用AI智能体主动显示天气预警、日程和家庭提醒。信实工业去年成立Reliance Intelligence,计划开发支持印度22种语言的AI基础设施和服务。AI产品Jio Call AgentMyJioTeleFrame信实工业智能体推荐理由:信实工业一口气发了三款AI产品,Jio Call Agent直接嵌入电信网络,覆盖5亿用户,玩法很实在。原文
22:56Decoder@Matthias Bastian根据Reuters Institute Digital News Report 2026,全球10%的用户每周使用AI聊天机器人获取新闻,较去年的7%有所上升。然而只有4%的用户会点击访问原始来源。报告显示用户对AI聊天机器人提供的新闻信任度仍然较低。行业Reuters InstituteDigital News Report 2026AI chatbots新闻获取信任度推荐理由:路透社最新报告显示,用AI聊天机器人看新闻的人从7%涨到10%,但才4%会点开原文,信任度真不高。原文
22:55Philipp Schmid@_philschmidPhil Schmid在X上分享对Go语言的看法,强调其编译速度快、控制流清晰、标准库强大,以及表达明确、立场鲜明等特点。他认为Go是构建AI和AI工具的强大语言。这些特性有助于提升开发效率。技巧GoAI工具编程语言开发效率推荐理由:Phil Schmid说Go语言很适合写AI工具,编译快、库全、语法干净,想试试吗?原文
22:54Yangyi@Yangyixxxx用户在Newmax平台测试了6个AI生成PPT的skill项目,包括ppt-master、baoyu-design、frontend-slides、guizang-ppt-skill、humanize-ppt和open-design,分别制作了小米17SU品牌发布PPT和高中课件。ppt-master被评价为最实用,即使无AI也能用SVG生成,支持导出PPTX带动效和演讲备注,但包体积较大、审美偏弱。baoyu-design功能多样,guizang-ppt-skill设计简约。用户计划在Newmax中内置ppt-master。技巧ppt-masterbaoyu-designNewmaxPPT生成演示文稿2 个信源在谈推荐理由:有人实测了6个AI做PPT的工具,说ppt-master最省心,还能导出带动效的PPTX,没AI也能用,推荐试试。原文
22:51IT之家(博客/媒体)美国联邦能源监管委员会下令6家区域电网运营商加快大型用电设施接入输电系统,以应对AI数据中心耗电激增。这些数据中心耗电量超过小城市,目前约占美国用电需求的5%,到2035年可能增至三倍。委员会成员一致通过新命令,覆盖服务2亿美国人的电网运营商,并邀请更多公用事业公司参与。行业FERCAI数据中心电网运营商能源政策推荐理由:美国能源监管委员要求6家电网加速给AI数据中心供电,耗电已超小城市,2035年或翻三倍。想了解AI对能源的影响?看这个。原文
22:39AWS Machine Learning Blog@Veda RamanAmazon Bedrock AgentCore 的 Web Search 功能现已全面可用。该功能使智能体能够实时检索网络信息,无需额外集成第三方搜索API。开发者只需添加几行代码即可让 Agent 调用 Web Search 能力,支持来源白名单与内容过滤。相比传统 RAG 方案,Web Search 能获取最新数据,适合需要动态知识更新的场景。AI产品Amazon Bedrock AgentCoreWeb Search智能体AWS推荐理由:AWS 在 Bedrock AgentCore 里直接内置了联网搜索,几行代码就能让智能体实时查最新信息,省去自己接搜索 API 的麻烦。原文
22:26Cloudflare Blog@Brendan Irvine-BroqueCloudflare 为 Workers 平台推出 Temporary Accounts 功能。AI 代理只需运行 wrangler deploy --temporary 命令,即可在数秒内获得一个可访问的 Worker 实例。该账户无需注册或配置,专为自动化部署设计。目前该功能已向所有用户开放。AI产品CloudflareWorkers临时账户部署AI agent推荐理由:Cloudflare 给 AI 代理开了个快速通道,几秒就能部署一个 Worker,不用走注册流程,挺省事的。原文
22:23Geek@geekbb这套模板基于改良版PARA方法,提供了完整的文件夹结构、模板和查询脚本。同时集成了Claude Code自动化,可自动整理知识库。整个系统开箱即用,可直接复用于个人知识管理。技巧ObsidianPARAClaude Code知识管理自动化工作流推荐理由:想要用Obsidian搭建第二大脑?这个模板把PARA方法、Claude Code自动化都整合好了,开箱即用,省去自己折腾的时间。原文
22:18Decoder@Maximilian Schreiner一项新基准测试评估了AI处理真实知识工作的能力。即使是最先进的AI模型,也仅能完全解决3%的任务。这一结果凸显了当前AI在处理复杂、多步骤的知识工作方面仍存在巨大短板。AI模型基准测试知识工作AI性能推荐理由:这个新基准狠狠打了AI的脸——最强模型也只完成3%的真实知识工作,别看平时吹得厉害。原文
22:15AWS Machine Learning Blog@Ebbey Thomas精选本文演示如何通过Model Context Protocol (MCP)在Amazon Quick中启用Adobe Marketing Agent。配置集成后,使用Adobe凭证进行身份验证即可获取最新洞察。示例工作流可返回受众排名、忠诚度细分摘要、旅程使用情况和冲突建议。技巧Adobe Marketing AgentAmazon QuickMCP/工具营销自动化工作流推荐理由:AWS博客教你一步步把Adobe Marketing Agent接进Amazon Quick,用MCP协议直接拿受众排名和忠诚度数据,营销人员省事多了。原文
21:58elvis@omarsar0开发者 Omar Sar 发布了名为 /youtube-notetaker 的开源 AI 技能。该技能能从 YouTube 视频自动生成 Artifacts,包括幻灯片、笔记和转录文本。用户可以自由定制。技能基于 xgo.ing 平台。AI产品youtube-notetaker智能体开源YouTube笔记工具推荐理由:Omar Sar 的这个开源技能能从 YouTube 视频自动生成幻灯片和笔记,省去手动记笔记的麻烦,还支持自定义。原文
21:57IT之家(博客/媒体)基于宇树G1改装的人形机器人Pemba成功登顶厄瓜多尔钦博拉索火山海拔6200米的顶峰。此次登山是足式机器人"三冠"探险计划的第一站,未来计划挑战珠穆朗玛峰。在坡度低于30度的路段Pemba可独立行走,但在持续16小时的冲顶阶段遇到陡峭地形时需探险队员协助。工程师为Pemba开发了专用热管理系统,应对极高海拔的严寒和温度变化;宇树G1曾在-47.4℃环境中运行。项目团队将利用强化学习系统逐步提高Pemba的自主行走能力,以适应更复杂地形。AI产品宇树G1Pemba人形机器人极端环境火山探测推荐理由:宇树G1改装的机器人Pemba爬上了6200米火山,未来还要挑战珠峰,能自主走缓坡,陡坡需要人帮。原文
21:56IT之家(博客/媒体)亚马逊米高梅工作室决定不再发行以 OpenAI CEO 萨姆·奥特曼为原型的传记电影《Artificial》,该片由卢卡·瓜达尼诺执导、安德鲁·加菲尔德主演,聚焦 2023 年 OpenAI 的“宫斗”事件,已接近完成且试映反响良好。亚马逊表示希望由其他片厂发行,并正与制作团队合作寻找新东家。此前亚马逊与 OpenAI 已签署价值 380 亿美元的云服务合同,并投资 500 亿美元扩大合作。行业亚马逊OpenAI萨姆·奥特曼电影发行传记电影10 个信源在谈推荐理由:亚马逊突然放弃发行这部还没上映的奥特曼传记片,电影讲的是 OpenAI 内部那场宫斗,加菲尔德主演,现在正在找接盘侠,业内八卦加商业瓜都有了。原文
21:53爱范儿@莫崇宇OpenAI 旗下的 Codex 模型迎来大更新。Codex 更新后可以学习用户电脑操作,将操作数据转化为训练素材。此次更新将 Codex 的能力从代码领域扩展到系统操作自动化。AI模型CodexOpenAI智能体10 个信源在谈推荐理由:嘿,OpenAI 的 Codex 又更新了,这次它能学习你在电脑上的操作,以后重复任务完全可以交给它,省心!原文
20:53IT之家(博客/媒体)麻省理工学院一项4月发布、持续4周、67人参与的研究发现,过度依赖聊天机器人可能削弱批判性思维。参与者借助基于GPT-4o的AI助手判断新闻真假,准确率提高21%,但第四周无AI帮助时独立判断能力下降15.3%。研究指出,AI直接给出答案而非引导思考,长期会削弱用户识别错误信息的能力。约四分之一参与者误以为能力提高,实际表现已变差。论文麻省理工学院GPT-4oChatGPT批判性思维AI伦理推荐理由:麻省理工用67人做了4周实验,发现依赖ChatGPT越久,你自己辨别假新闻的能力反而下降15%——别把脑子外包给AI。原文
20:27AI Will@FinanceYF5Listen Labs推出未来创始人项目,面向想创业的工程师,提供全职薪资、福利和Sequoia等投资者指导。Anthropic的Claude Corps为期12个月,资助早期建设者在非营利组织部署AI工具,薪资$85K加福利,第1批7月17日截止。a16z的FDE奖学金为时8周,面向企业部署工程师。Vals AI奖学金每周$1K–2.5K,解决AI评估难题。Perplexity研究驻留年薪$220K,支持远程或SF办公。DoorDash研究奖学金为期3-6个月,提供计算和住房补贴。Amplify Partners写作奖学金为期3个月,面向技术人员。行业Anthropica16zPerplexityAI奖学金项目机会10 个信源在谈推荐理由:想进Anthropic、a16z、Perplexity?这里有7个带薪奖学金项目,最高$220K年薪,截止日期近,赶紧看看原文
20:24Guillermo Rauch@rauchgVercel CEO Rauchg在X上发文指出,Agent(智能体)正在激励众多健康的软件工程习惯,包括开放API、文档(技能)、测试(评估)、Unix命令行界面、支付与商业协议,甚至广泛采用Accept头(支持markdown/json/html)。他认为这是万维网原始愿景在眼前的实现。该帖获得113个点赞和3420次浏览。行业智能体开放APICLI软件测试开发实践推荐理由:Rauchg总结了Agent如何驱动开放API、文档、测试等好习惯,做软件的值得一看。原文
19:19AI Will@FinanceYF576°Jeff Bezos 宣布成立新 AI 实验室 Prometheus,专注于物理世界应用。该实验室已融资 120 亿美元,估值达 410 亿美元,Bezos 是主要支持者。实验室由 Bezos 与前 Google X 主管 Vik Bajaj 共同创立。行业PrometheusJeff BezosVik BajajAI实验室融资推荐理由:贝佐斯砸120亿美元搞物理世界AI实验室,和前Google X主管一起干,估值410亿,想落地机器人、制造等领域。原文
19:18AI Will@FinanceYF583°杰夫·贝佐斯宣布成立新AI实验室Prometheus,专注物理世界工程。该实验室已筹集120亿美元,估值达410亿美元,贝佐斯为主要出资人。联合创始人Vik Bajaj曾任Google X总监。使命是构建能吸收物理世界数据的人工通用工程师,加速工程与制造。行业PrometheusJeff BezosVik BajajGoogle X物理世界AI推荐理由:贝佐斯砸120亿美元搞了个新实验室,不卷大语言模型,而是做物理世界AI工程师。有点意思。原文
18:53IT之家(博客/媒体)73°智谱于6月17日开源新一代旗舰大模型GLM-5.2,其在FrontierSWE编程基准测试中得分74.4,超过OpenAI GPT-5.5,仅落后Anthropic Claude Opus 4.8约1个百分点。马斯克在X上回应网友提问时预测,中国大模型可能要到2027年第一季度才能达到Anthropic Fable水平。智谱创始人唐杰随即表示不需要那么久。马斯克补充说跑分赶上相对容易,但实用性才是关键。谷歌DeepMind CEO哈萨比斯此前也认为中美模型水平差距可能仅差几个月。行业马斯克智谱GLM-5.2Anthropic Fable推理模型10 个信源在谈推荐理由:马斯克说国产大模型要等到2027年才能追上Anthropic的Fable,但智谱的唐杰直接回怼用不了那么久。GLM-5.2刚在编程测试上赢了GPT-5.5,差距正在缩小。原文