03:58lmarena.ai@lmarena_aiGLM-5.2 (Max) 在 Text Arena 总榜排名第25位,与上一版本 GLM-5.1 水平接近。在 Expert Arena 和 Multi-Turn 子类别中取得较大进步。在生命科学、社会科学、创意写作和医学医疗等职业类别中表现提升。AI模型GLM-5.2GLM-5.1智谱Text Arena多轮对话推荐理由:智谱新模型 GLM-5.2 整体排名没变,但在专家问答和多轮对话上进步明显,写创意和医学内容更强了。原文
23:22lmarena.ai@lmarena_aiGLM-5.2 模型已在 Text Arena 和 Code Arena: Frontend 中可用。用户可以通过 arena.ai/agent 平台测试该模型在真实世界任务上的表现。该平台旨在评估 AI 性能的前沿。AI模型GLM-5.2Text ArenaCode Arenaarena.ai智能体推荐理由:试试 GLM-5.2 在真实任务中的表现原文
22:17lmarena.ai@lmarena_ai73°斯坦福AI指数报告显示,中美AI模型差距已从三年前的278%缩小至仅2.7%。实际评测中,Anthropic的Claude Opus 4.6 Thinking与百度的Ernie 5.1在Text Arena排行榜上紧咬,美国虽仍居第一,但差距持续收窄。这一趋势反映了中国AI模型的快速追赶,尤其在推理和对话能力上。对关注全球AI竞争格局的从业者而言,这是重要的风向标。行业中美AI竞争模型评测Claude Opus 4.6百度Ernie 5.1Text Arena10 个信源在谈推荐理由:中美AI差距从278%缩到2.7%,做模型评测或关注国际竞争的团队值得一看——百度Ernie 5.1已经能跟Claude Opus 4.6 Thinking掰手腕了。原文