08:27rohanpaul_ai@rohanpaul_aiAnthropic 表示其 80% 的新生产代码由 Claude 编写,标志着 AI 编程在大型科技公司中的深度应用。Google 新论文显示通用 LLM 通过规划证明和逐步检查,在形式数学任务上从低于 10% 提升至 70% 的准确率。Google 开源 Gemma 4 12B 模型,支持音频和视频分析,可在消费级 16GB GPU 上完全本地运行。阿里巴巴发布 Qwen3.7-Plus,支持文本、视频和图像输入,价格低廉但保持闭源。Anthropic 的化学报告也展示了令人惊讶的结果。行业AnthropicClaudeGoogleGemma 4Qwen3.7-PlusAI编程数学推理开源模型10 个信源在谈推荐理由:AI 编程和数学推理的突破正在改变开发和研究方式,做 AI 应用或数学研究的团队值得关注这些进展,尤其是 Claude 的代码生成和 Gemma 4 的本地部署能力。原文
09:32阿里通义 Qwen@Alibaba_Qwen83°阿里 Qwen 团队正式推出 Qwen3.7-Plus,这是一款将视觉与语言能力统一的多模态智能体模型。它支持多模态交互混合智能体,可同时处理 GUI 和 CLI 操作;具备全模态输入的编程助手与生产力工具能力;视觉方面涵盖感知、推理、定位和搜索增强问答。该模型在多种智能体框架上表现出跨框架泛化能力,现已通过阿里云 Model Studio API 开放使用。AI模型多模态智能体Qwen3.7-Plus阿里云API3 个信源在谈推荐理由:做多模态应用或智能体开发的团队可以直接用 API 试——一个模型搞定看、想、写、做,省去多模型拼接的麻烦。原文
08:14岚叔@lufzzlizQwen3.7-Plus 是通义千问最新推出的多模态模型,延续了 Plus 系列的高性价比特点。该模型不仅支持屏幕读取、网页/移动端/桌面端操作,还能编写代码、调用工具和处理工作流。当前行业趋势正朝向多模态 Agent 发展,Qwen3.7-Plus 在长链路稳定性、工具调用失败恢复以及 GUI 操作权限与审计边界方面有所加强。该模型适合需要构建复杂自动化任务的开发者和团队。AI模型Qwen3.7-Plus多模态Agent工具调用性价比3 个信源在谈推荐理由:Qwen3.7-Plus 把多模态 Agent 的实用门槛又拉低了一截,做自动化工作流或 GUI 操作的开发者可以直接关注,性价比和功能覆盖都很能打。原文
08:13岚叔@lufzzliz用户对Qwen3.7-Plus进行了10项测评任务,整体完成度尚可。新加入的测评任务中,倒计时功能出现圈与数字分离的瑕疵,粒子引力场存在页面卡顿bug,拟物相机任务与SOTA模型差距明显,洗车问题相比Qwen3.6-Plus出现倒退。完整测评结果已公开。AI模型Qwen3.7-Plus模型测评通义千问SOTA差距任务测试3 个信源在谈推荐理由:Qwen3.7-Plus在多项任务中表现尚可,但新任务暴露了与SOTA模型的差距,关注通义千问系列进展的开发者可以看看具体哪些场景翻车了。原文
01:54阿里通义 Qwen@Alibaba_Qwen精选Qwen3.7-Plus在文本基准测试中展现出竞争力,整体表现逼近Max级别模型。该结果来自Qwen官方发布的性能1测试。目前尚无具体基准和分数细节。AI模型Qwen3.7-PlusQwenAlibaba文本基准3 个信源在谈推荐理由:Qwen新模型性能追平高端原文