GLM 5.1 是智谱AI在2026年上半年推出的新一代大语言模型,以极快的推理速度、低成本和高性能的智能体(Agent)能力引起行业关注。其高速API版本输出速度达400 tokens/s,创下全球纪录,同时基于该模型的Agent Arena评测和法律基准测试显示其在真实世界任务和专项应用中的潜力。
- 主要进展:
- 推理速度突破:智谱AI推出GLM-5.1高速API,输出速度达400 tokens/s,为全球最快,大幅降低了延迟和成本(智谱AI推出GLM-5.1高速API;IT之家报道)。
- 智能体评测与协作:在Agent Arena中,GLM 5.1表现出色,可自主完成任务并接受反馈训练;与Claude Opus 4.7组合的“顾问模式”在法律基准上得分18/100,成本降低61%(Agent Arena发布;Fireworks AI顾问模式)。
- 生态与应用扩展:Ollama为GLM-5.1增加NVIDIA Blackwell GPU支持,Fireworks推出LoRA RL训练平台,模型还具备“Agent可直接训练模型”能力(Ollama更新;Fireworks训练平台;AI Engineer报道)。
当前焦点与未来观察点:
GLM 5.1的竞争焦点在于其速度与成本优势能否在复杂任务(如法律、浏览)中持续领先,以及开源生态(如Ollama)和可训练性(LoRA RL)对开发者社区的吸引力。需关注与闭源模型(Claude、Gemini)在基准测试中的实际差距,以及智能体自主训练能力带来的安全与可控性讨论。