精选理由
Qwen3.7-Max 在智能体可靠性上的突破,让做自动化工作流和复杂任务编排的开发者有了更稳定的选择,建议直接上手测试。
阿里巴巴发布了其最强旗舰模型 Qwen3.7-Max,专为真实世界任务和生产环境设计。该模型在智能体可靠性上做了核心优化,能够自主规划步骤、调用工具、检查结果并修复错误,不会在首次出错后崩溃。在 Artificial Analysis Intelligence Index 上,Qwen3.7-Max 得分 56.6,较 Qwen3.6-Max 提升 4.8 分,排名第五,与 GPT 5.4 相当。性能提升主要集中在科学推理、智能体能力和编程方面。此外,推理内核经过多轮底层 GPU 优化,实现了 10 倍的几何平均加速。
AI 翻译 · 中文
阿里巴巴发布了其最强旗舰模型 Qwen3.7-Max,专为真实世界任务和生产环境设计。该模型在智能体可靠性上做了核心优化,能够自主规划步骤、调用工具、检查结果并修复错误,不会在首次出错后崩溃。在 Artificial Analysis Intelligence Index 上,Qwen3.7-Max 得分 56.6,较 Qwen3.6-Max 提升 4.8 分,排名第五,与 GPT 5.4 相当。性能提升主要集中在科学推理、智能体能力和编程方面。此外,推理内核经过多轮底层 GPU 优化,实现了 10 倍的几何平均加速。
Alibaba just released Qwen3.7-Max. Their best flagship model built for real-world tasks and production environments. - Agent reliability the center of the story, where the model must plan steps, call tools, inspect re…