全部 AI 动态 · AI 热点

6月17日

03:58

03:58

lmarena.ai@lmarena_ai

GLM-5.2 (Max) 在 Text Arena 总榜排名第25位，与上一版本 GLM-5.1 水平接近。在 Expert Arena 和 Multi-Turn 子类别中取得较大进步。在生命科学、社会科学、创意写作和医学医疗等职业类别中表现提升。

AI模型 GLM-5.2 GLM-5.1 智谱 Text Arena 多轮对话

推荐理由：智谱新模型 GLM-5.2 整体排名没变，但在专家问答和多轮对话上进步明显，写创意和医学内容更强了。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

13:22

13:22

Z.ai (智谱国际)@Zai_org

智谱AI宣布将GLM-5.1和GLM-5-Turbo的“三倍用量”优惠期延长至6月30日。用户可在除美国东部时间凌晨2-6点外的任意时段使用。这一调整让开发者有更多时间以更低成本体验高性能模型，适合需要大模型推理和生成能力的团队。

AI产品智谱AI GLM-5.1 GLM-5-Turbo 优惠延长大模型

推荐理由：智谱延长三倍用量优惠，做AI应用开发的团队可以趁此机会低成本测试GLM-5系列模型，建议有需求的开发者抓紧使用。

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月5日

01:19

01:19

lmarena.ai@lmarena_ai

88°

Agent Arena 是一个全新的智能体评测平台，通过数百万次真实用户会话，衡量模型在完成实际任务（如编写代码、创建幻灯片、网页研究、构建应用、分析文档）时的表现。评测基于五个信号：任务成功率、可操控性、错误恢复、用户表扬/抱怨比、工具幻觉。排行榜基于 30 万+任务、200 万+工具调用和 4000 万行代码构建，当前排名第一为 OpenAI GPT-5.5，其次为 Anthropic Claude Opus 4.7、智谱 GLM-5.1、Google Gemini 3.1 Pro 和 Kimi K2.6。该平台旨在解决智能体在真实场景中难以评估的问题，为开发者提供更贴近实际使用的性能参考。

AI产品智能体评测/基准 GPT-5.5 Claude Opus 4.7 GLM-5.1

推荐理由：智能体评测终于从玩具任务走向真实场景——做 AI 应用或智能体开发的团队，可以直接用 Arena 的评测结果来选模型，比跑基准测试更有参考价值。

5月16日

19:32

19:32

ollama@ollama

Ollama 宣布为其云服务大幅增加 NVIDIA Blackwell GPU，以更好地支持 GLM-5.1 模型。同时，Ollama 也在每日为其他模型增加 GPU 资源。用户可通过 Ollama 的 Claude Code、Codex App 和 Hermes Agent 等工具调用 GLM-5.1 模型。该模型可通过命令 `ollama run glm-5.1:cloud` 直接运行。此举旨在提升模型推理性能和可用性。

AI产品 Ollama GLM-5.1 NVIDIA Blackwell GPU 云服务模型部署

推荐理由：Ollama 为 GLM-5.1 加 GPU 意味着推理速度更快、并发更高，做 AI 应用开发或依赖云端大模型的团队值得关注，可以直接用命令体验。