精选理由
GLM-5.2跑得快,长上下文和智能体场景下Together的优化让token更多更流畅,试试看。
GLM-5.2模型已在Together AI平台上架,并通过OpenRouter快速提供服务。Together AI优化推理路径,使模型在长上下文编码和智能体工作负载中每GPU能处理更多token,同时保持低延迟。该模型展现出强劲性能,适合需要高吞吐的复杂任务。
AI 翻译 · 中文
GLM-5.2模型已在Together AI平台上架,并通过OpenRouter快速提供服务。Together AI优化推理路径,使模型在长上下文编码和智能体工作负载中每GPU能处理更多token,同时保持低延迟。该模型展现出强劲性能,适合需要高吞吐的复杂任务。
GLM-5.2 on Together AI is showing up fast on @OpenRouter ⚡️ The model is strong, and our serving path makes that strength usable in the loop. Together has been pushing hard on inference so long-context coding and agent w…