15:24Decoder@Jonathan Kemper83°阿里巴巴Qwen团队发布Qwen3.7-Plus,这是一个多模态智能体模型,集视觉感知、GUI操作和编码于一体。在演示中,基于该模型的智能体自主开发了一款词汇学习应用,在11小时内通过1000次智能体调用生成了超过10000行代码。该模型在Qwen自己的基准测试中屏幕理解能力领先,但整体性能参差不齐。Qwen3.7-Plus是专有模型,未开源,定价远低于西方前沿模型。AI模型多模态智能体Qwen3.7-Plus阿里巴巴自主开发1 个信源在谈推荐理由:阿里将多模态AI推向自主智能体新高度,做GUI自动化或端到端应用开发的团队值得关注——它能自己写代码、操作界面,11小时产出上万行代码,效率惊人。原文
08:27rohanpaul_ai@rohanpaul_aiAnthropic 表示其 80% 的新生产代码由 Claude 编写,标志着 AI 编程在大型科技公司中的深度应用。Google 新论文显示通用 LLM 通过规划证明和逐步检查,在形式数学任务上从低于 10% 提升至 70% 的准确率。Google 开源 Gemma 4 12B 模型,支持音频和视频分析,可在消费级 16GB GPU 上完全本地运行。阿里巴巴发布 Qwen3.7-Plus,支持文本、视频和图像输入,价格低廉但保持闭源。Anthropic 的化学报告也展示了令人惊讶的结果。行业AnthropicClaudeGoogleGemma 4Qwen3.7-PlusAI编程数学推理开源模型10 个信源在谈推荐理由:AI 编程和数学推理的突破正在改变开发和研究方式,做 AI 应用或数学研究的团队值得关注这些进展,尤其是 Claude 的代码生成和 Gemma 4 的本地部署能力。原文
17:15marktechpost@Michal Sutter83°阿里Qwen团队在百炼平台推出Qwen3.7-Plus,这是一个多模态智能体模型。它不仅能理解图像和视频,还新增了自主编程、工具调用和深度推理能力。该模型支持视觉理解、复杂推理和自动化迭代,可应用于更广泛的AI任务场景。这标志着阿里在构建全能型AI智能体方面迈出重要一步。AI模型Qwen3.7-Plus多模态智能体工具调用百炼平台3 个信源在谈推荐理由:Qwen3.7-Plus把视觉、推理和工具调用整合到一个模型里,做多模态应用的开发者可以直接在百炼平台体验,省去拼接多个模型的麻烦。原文
09:32阿里通义 Qwen@Alibaba_Qwen83°阿里 Qwen 团队正式推出 Qwen3.7-Plus,这是一款将视觉与语言能力统一的多模态智能体模型。它支持多模态交互混合智能体,可同时处理 GUI 和 CLI 操作;具备全模态输入的编程助手与生产力工具能力;视觉方面涵盖感知、推理、定位和搜索增强问答。该模型在多种智能体框架上表现出跨框架泛化能力,现已通过阿里云 Model Studio API 开放使用。AI模型多模态智能体Qwen3.7-Plus阿里云API3 个信源在谈推荐理由:做多模态应用或智能体开发的团队可以直接用 API 试——一个模型搞定看、想、写、做,省去多模型拼接的麻烦。原文
08:14岚叔@lufzzlizQwen3.7-Plus 是通义千问最新推出的多模态模型,延续了 Plus 系列的高性价比特点。该模型不仅支持屏幕读取、网页/移动端/桌面端操作,还能编写代码、调用工具和处理工作流。当前行业趋势正朝向多模态 Agent 发展,Qwen3.7-Plus 在长链路稳定性、工具调用失败恢复以及 GUI 操作权限与审计边界方面有所加强。该模型适合需要构建复杂自动化任务的开发者和团队。AI模型Qwen3.7-Plus多模态Agent工具调用性价比3 个信源在谈推荐理由:Qwen3.7-Plus 把多模态 Agent 的实用门槛又拉低了一截,做自动化工作流或 GUI 操作的开发者可以直接关注,性价比和功能覆盖都很能打。原文
08:13岚叔@lufzzliz用户对Qwen3.7-Plus进行了10项测评任务,整体完成度尚可。新加入的测评任务中,倒计时功能出现圈与数字分离的瑕疵,粒子引力场存在页面卡顿bug,拟物相机任务与SOTA模型差距明显,洗车问题相比Qwen3.6-Plus出现倒退。完整测评结果已公开。AI模型Qwen3.7-Plus模型测评通义千问SOTA差距任务测试3 个信源在谈推荐理由:Qwen3.7-Plus在多项任务中表现尚可,但新任务暴露了与SOTA模型的差距,关注通义千问系列进展的开发者可以看看具体哪些场景翻车了。原文
06:41IT之家(博客/媒体)精选阿里千问大模型推出 Qwen3.7-Plus,定位为多模态交互混合智能体,在保留文本、编码、工具使用等能力基础上,强化了视觉理解、视觉推理和跨模态任务处理。该模型支持图像、视频、屏幕、网页和文本输入,可在 GUI、CLI 和工具环境中完成复杂软件与办公流程。在 Vision Arena 评测中,阿里凭借该模型进入全球前 5、中国第 1,多模态测试在 BabyVision、MathVision 等基准上提升明显。模型已通过阿里云百炼和 Qwen Studio 提供服务。AI模型Qwen3.7-Plus多模态智能体阿里千问视觉理解4 个信源在谈推荐理由:Qwen3.7-Plus 把视觉与语言统一到智能体基座,做多模态应用或办公自动化的团队可以直接在百炼上试,能省掉不少模型拼接的麻烦。原文
01:54阿里通义 Qwen@Alibaba_Qwen精选Qwen3.7-Plus在文本基准测试中展现出竞争力,整体表现逼近Max级别模型。该结果来自Qwen官方发布的性能1测试。目前尚无具体基准和分数细节。AI模型Qwen3.7-PlusQwenAlibaba文本基准3 个信源在谈推荐理由:Qwen新模型性能追平高端原文