智谱 GLM-5.2 发布并开源,百万上下文与思考力度控制

智谱 GLM-5.2 正式发布和开源了,基准测试成绩相当吓人 核心定位是处理长周期任务,并且有稳定的 100 万上下文,模型还引入了思考力度控制。 架构层面,GLM-5.2 提出了 IndexSh...

精选理由

智谱的 GLM-5.2 百万上下文还能降低计算量 2.9 倍,开源且支持思考力度调节,搞长任务和 agent 的赶紧试试。

AI 摘要

智谱发布并开源了 GLM-5.2 模型,核心定位是处理长周期任务,提供稳定的 100 万 token 上下文。模型引入 IndexShare 机制,每四层稀疏注意力共享 indexer,在百万 token 下每 token 计算量降低约 2.9 倍。GLM-5.2 提供两种思考力度模式:GLM-5.2 (max) 追求极致性能,GLM-5.2 (high) 平衡性能与 token 效率。该模型采用 MIT 开源许可,API 定价与 GLM-5.1 相同。在多项基准测试中,GLM-5.2 在编程和智能体任务上表现显著提升。

AI 翻译 · 中文

智谱发布并开源了 GLM-5.2 模型,核心定位是处理长周期任务,提供稳定的 100 万 token 上下文。模型引入 IndexShare 机制,每四层稀疏注意力共享 indexer,在百万 token 下每 token 计算量降低约 2.9 倍。GLM-5.2 提供两种思考力度模式:GLM-5.2 (max) 追求极致性能,GLM-5.2 (high) 平衡性能与 token 效率。该模型采用 MIT 开源许可,API 定价与 GLM-5.1 相同。在多项基准测试中,GLM-5.2 在编程和智能体任务上表现显著提升。

歸藏(guizang.ai)智谱 GLM-5.2 正式发布和开源了,基准测试成绩相当吓人 核心定位是处理长周期任务,并且有稳定的 100 万上下文,模型还引入了思考力度控制。 架构层面,GLM-5.2 提出了 IndexShare 机制,每四层稀疏注意力共享同一个 indexer,从而在百万 token 上下文下将每 token 的计算量降低约 2.9 倍。 Z.ai @Zai_org Introducing GLM-5.2: Frontier Intellige