精选理由
Zai_org 发了 GLM-5.2,在 Agent 任务榜单上排第10,碾压所有开源模型,而且价格没变。跑复杂工作流、调工具效果明显进步。
GLM-5.2 (Max) 在 Agent Arena 排行榜上排名第10,得分接近 Claude-Opus-4.8(非推理模式)。它成为排名最高的开源模型,较去年发布的 GLM-5.1 从第13位上升3位。该模型在数百万真实长程任务上评测,可调用网页搜索、文件系统和终端工具。GLM-5.2 (Max) 输入/输出定价保持为每百万 token 1.4/4.4 美元,支持1M上下文窗口,权重采用 MIT 许可开源。
AI 翻译 · 中文
GLM-5.2 (Max) 在 Agent Arena 排行榜上排名第10,得分接近 Claude-Opus-4.8(非推理模式)。它成为排名最高的开源模型,较去年发布的 GLM-5.1 从第13位上升3位。该模型在数百万真实长程任务上评测,可调用网页搜索、文件系统和终端工具。GLM-5.2 (Max) 输入/输出定价保持为每百万 token 1.4/4.4 美元,支持1M上下文窗口,权重采用 MIT 许可开源。
GLM-5.2 (Max) by @Zai_org ranks #10 on the new Agent Arena leaderboard, closely matching Claude-Opus-4.8 (non-thinking) and is the #1 open model by a wide margin! In Agent Arena, we measure models on millions of real-wor…