GLM 5.1

§ 01综述

GLM 5.1 是智谱AI在2026年上半年推出的新一代大语言模型，以极快的推理速度、低成本和高性能的智能体（Agent）能力引起行业关注。其高速API版本输出速度达400 tokens/s，创下全球纪录，同时基于该模型的Agent Arena评测和法律基准测试显示其在真实世界任务和专项应用中的潜力。

主要进展：

推理速度突破：智谱AI推出GLM-5.1高速API，输出速度达400 tokens/s，为全球最快，大幅降低了延迟和成本（智谱AI推出GLM-5.1高速API；IT之家报道）。
智能体评测与协作：在Agent Arena中，GLM 5.1表现出色，可自主完成任务并接受反馈训练；与Claude Opus 4.7组合的“顾问模式”在法律基准上得分18/100，成本降低61%（Agent Arena发布；Fireworks AI顾问模式）。
生态与应用扩展：Ollama为GLM-5.1增加NVIDIA Blackwell GPU支持，Fireworks推出LoRA RL训练平台，模型还具备“Agent可直接训练模型”能力（Ollama更新；Fireworks训练平台；AI Engineer报道）。

当前焦点与未来观察点：
GLM 5.1的竞争焦点在于其速度与成本优势能否在复杂任务（如法律、浏览）中持续领先，以及开源生态（如Ollama）和可训练性（LoRA RL）对开发者社区的吸引力。需关注与闭源模型（Claude、Gemini）在基准测试中的实际差距，以及智能体自主训练能力带来的安全与可控性讨论。

§ 02相关报道09 条在档

§ 03邻近话题