全部 AI 动态 · AI 热点

6月17日

03:58

03:58

lmarena.ai@lmarena_ai

GLM-5.2 (Max) 在 Text Arena 总榜排名第25位，与上一版本 GLM-5.1 水平接近。在 Expert Arena 和 Multi-Turn 子类别中取得较大进步。在生命科学、社会科学、创意写作和医学医疗等职业类别中表现提升。

AI模型 GLM-5.2 GLM-5.1 智谱 Text Arena 多轮对话

推荐理由：智谱新模型 GLM-5.2 整体排名没变，但在专家问答和多轮对话上进步明显，写创意和医学内容更强了。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月13日

23:22

23:22

lmarena.ai@lmarena_ai

GLM-5.2 模型已在 Text Arena 和 Code Arena: Frontend 中可用。用户可以通过 arena.ai/agent 平台测试该模型在真实世界任务上的表现。该平台旨在评估 AI 性能的前沿。

AI模型 GLM-5.2 Text Arena Code Arena arena.ai 智能体

推荐理由：试试 GLM-5.2 在真实任务中的表现

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月16日

22:17

22:17

lmarena.ai@lmarena_ai

73°

斯坦福AI指数报告显示，中美AI模型差距已从三年前的278%缩小至仅2.7%。实际评测中，Anthropic的Claude Opus 4.6 Thinking与百度的Ernie 5.1在Text Arena排行榜上紧咬，美国虽仍居第一，但差距持续收窄。这一趋势反映了中国AI模型的快速追赶，尤其在推理和对话能力上。对关注全球AI竞争格局的从业者而言，这是重要的风向标。

行业中美AI竞争模型评测 Claude Opus 4.6 百度Ernie 5.1 Text Arena

推荐理由：中美AI差距从278%缩到2.7%，做模型评测或关注国际竞争的团队值得一看——百度Ernie 5.1已经能跟Claude Opus 4.6 Thinking掰手腕了。