GLM-5.2 在 DeepSWE 基准上超越 Kimi-K2.7 Code,成为最佳开源模型

GLM-5.2 beats Kimi-K2.7 Code for top open model on…

精选理由

智谱的 GLM-5.2 代码上刚赢了 Kimi 的 K2.7,但更贵输出也更多,离顶级闭源还有距离。

AI 摘要

GLM-5.2 在 DeepSWE 编程基准上取得 44% 的得分,超过 Kimi-K2.7 Code,成为目前最强的开源模型。不过它的运行成本更高,且每次输出更多 tokens。与封闭模型相比,Claude Fable 5 以 70% 的得分领先,差距明显。

AI 翻译 · 中文

GLM-5.2 在 DeepSWE 编程基准上取得 44% 的得分,超过 Kimi-K2.7 Code,成为目前最强的开源模型。不过它的运行成本更高,且每次输出更多 tokens。与封闭模型相比,Claude Fable 5 以 70% 的得分领先,差距明显。

@koltregaskesGLM-5.2 beats Kimi-K2.7 Code for top open model on DeepSWE, though is dearer to run and outputs more tokens. At 44% it's quite a distance away from the closed models, such as top model Claude Fable 5 at 70%. https://t.co