开源模型GLM-5.2进入Agent Arena，挑战GPT-5.5和Claude-Opus-4.7

精选理由

看看GLM-5.2在Agent Arena能排第几

AI 摘要

GLM-5.2是Zai_org发布的最新开源模型，已加入Agent Arena评测平台。该平台通过30万+任务、200万+工具调用和4000万行代码评估模型在搜索、文件系统和终端工具上的智能体性能。当前排行榜前五名包括GPT-5.5（第一）、Claude-Opus-4.7（第二）、GLM-5.1（第三）、Gemini-3.1-Pro（第四）和Kimi-K2.6（第五）。GLM-5.2将与其他模型竞争，展示其智能体能力。

AI 翻译 · 中文

lmarena.aiOpen source model, GLM-5.2 is in Agent Arena - it's the latest from @Zai_org . In Agent Arena, models have access to search, filesystem, and terminal tools to complete complex workflows: writing code, creating slides…

arXiv: Anthropic06-15 10:37原文

查看原推