00:53elvis@omarsar0精选GLM-5.2 在图形设计能力上据称达到 Opus 级别,同时在长期运行任务中表现良好。其训练引入了反奖励破解模块,用于解决强化学习中常见的奖励破解问题,例如模型走捷径、变懒、意图偏差等。该模块有助于提升编码代理在长周期任务中的可靠性与效果。GLM-5.2 是一个开源开放权重模型。AI模型GLM-5.2奖励破解开源模型设计长期任务推荐理由:GLM-5.2 据称设计和长任务都接近 Opus,关键是加了个反奖励破解机制,让模型更靠谱。原文