03:58lmarena.ai@lmarena_aiGLM-5.2 (Max) 在 Text Arena 总榜排名第25位,与上一版本 GLM-5.1 水平接近。在 Expert Arena 和 Multi-Turn 子类别中取得较大进步。在生命科学、社会科学、创意写作和医学医疗等职业类别中表现提升。AI模型GLM-5.2GLM-5.1智谱Text Arena多轮对话推荐理由:智谱新模型 GLM-5.2 整体排名没变,但在专家问答和多轮对话上进步明显,写创意和医学内容更强了。原文
13:22Z.ai (智谱国际)@Zai_org智谱AI宣布将GLM-5.1和GLM-5-Turbo的“三倍用量”优惠期延长至6月30日。用户可在除美国东部时间凌晨2-6点外的任意时段使用。这一调整让开发者有更多时间以更低成本体验高性能模型,适合需要大模型推理和生成能力的团队。AI产品智谱AIGLM-5.1GLM-5-Turbo优惠延长大模型1 个信源在谈推荐理由:智谱延长三倍用量优惠,做AI应用开发的团队可以趁此机会低成本测试GLM-5系列模型,建议有需求的开发者抓紧使用。原文
01:19lmarena.ai@lmarena_ai88°Agent Arena 是一个全新的智能体评测平台,通过数百万次真实用户会话,衡量模型在完成实际任务(如编写代码、创建幻灯片、网页研究、构建应用、分析文档)时的表现。评测基于五个信号:任务成功率、可操控性、错误恢复、用户表扬/抱怨比、工具幻觉。排行榜基于 30 万+任务、200 万+工具调用和 4000 万行代码构建,当前排名第一为 OpenAI GPT-5.5,其次为 Anthropic Claude Opus 4.7、智谱 GLM-5.1、Google Gemini 3.1 Pro 和 Kimi K2.6。该平台旨在解决智能体在真实场景中难以评估的问题,为开发者提供更贴近实际使用的性能参考。AI产品智能体评测/基准GPT-5.5Claude Opus 4.7GLM-5.110 个信源在谈推荐理由:智能体评测终于从玩具任务走向真实场景——做 AI 应用或智能体开发的团队,可以直接用 Arena 的评测结果来选模型,比跑基准测试更有参考价值。原文
19:32ollama@ollamaOllama 宣布为其云服务大幅增加 NVIDIA Blackwell GPU,以更好地支持 GLM-5.1 模型。同时,Ollama 也在每日为其他模型增加 GPU 资源。用户可通过 Ollama 的 Claude Code、Codex App 和 Hermes Agent 等工具调用 GLM-5.1 模型。该模型可通过命令 `ollama run glm-5.1:cloud` 直接运行。此举旨在提升模型推理性能和可用性。AI产品OllamaGLM-5.1NVIDIA Blackwell GPU云服务模型部署推荐理由:Ollama 为 GLM-5.1 加 GPU 意味着推理速度更快、并发更高,做 AI 应用开发或依赖云端大模型的团队值得关注,可以直接用命令体验。原文