精选理由
多模态智能体模型将视觉与语言统一,做自动化操作和智能体开发的团队可以直接用 API 试,省去自己拼接多模型的工作。
阿里巴巴 Qwen 团队发布 Qwen3.7-Plus,一个多模态智能体模型,统一了视觉和语言能力。该模型支持多模态交互式混合智能体,可同时处理 GUI 和 CLI 操作,具备视觉感知、推理、定位和搜索增强问答能力。它还能作为全能编码助手和生产力工具,接受全模态输入。Qwen3.7-Plus 现已通过阿里云模型服务 API 提供,开发者可直接尝试。
AI 翻译 · 中文
阿里巴巴 Qwen 团队发布 Qwen3.7-Plus,一个多模态智能体模型,统一了视觉和语言能力。该模型支持多模态交互式混合智能体,可同时处理 GUI 和 CLI 操作,具备视觉感知、推理、定位和搜索增强问答能力。它还能作为全能编码助手和生产力工具,接受全模态输入。Qwen3.7-Plus 现已通过阿里云模型服务 API 提供,开发者可直接尝试。
open source, wen? Qwen @Alibaba_Qwen 👏👏 Introducing Qwen3.7-Plus — a multimodal agent model that unifies vision and language into one versatile agent foundation. ✅ Multimodal interactive hybrid agent: unified GUI &…