12:35arXiv: OpenAI@Mostapha BenhendaFinance Agent v2仅处理上市公司定期报告(SEC 10-K/10-Q),不适用于IPO尽职调查。新基准IPO Finance Agent扩展了任务领域和检索架构,采用上下文检索处理长文档,如SpaceX的S-1文件。该基准包含1000个IPO尽职调查问题,公开70个SpaceX问题,并引入自动生成评估标准管道。最佳模型Alibaba Qwen 3.7 Max准确率79.4%,成本$0.30/查询;最经济模型Xiaomi MiMo-2.5 Pro准确率76.8%,成本$0.05/查询,均超越Finance Agent v2领先者Google Gemini 3.5 Flash(57.9%,$2.51/查询)。论文IPO Finance AgentSpaceXQwen 3.7MiMo-2.5 Pro基准测试1 个信源在谈推荐理由:想测模型做IPO分析的功力?这篇论文搞了新基准,Qwen 3.7最强但贵,小米MiMo性价比炸裂,值得看。原文
01:46阿里云 Alibaba Cloud@alibaba_cloud阿里云在VivaTech 2026大会上,由Jeff Fu介绍Qwen 3.7和Agentic Cloud基础设施。Qwen 3.7是阿里云最新的大语言模型,Agentic Cloud提供构建智能体应用的云原生架构。参会者可了解如何利用这些技术构建全栈智能引擎。AI模型Qwen 3.7阿里云智能体Agentic Cloud推荐理由:想了解阿里云最新大模型Qwen 3.7和智能体云架构?去VivaTech 2026听Jeff Fu聊聊。原文
01:39kimmonismus@kimmonismus里约热内卢市政府IT公司发布了开源模型 Rio 3.5 Open 397B,参数量达 397B。该模型在多项基准测试中达到开源 SOTA,甚至超越此前领先的 Qwen 3.7。这一成果来自此前并不知名的团队,引发业界关注。AI模型Rio 3.5 Open 397BQwen 3.7开源模型1 个信源在谈推荐理由:里约市政府搞了个 397B 的开源模型,居然跑赢了 Qwen 3.7,挺意外的,建议看看。原文
17:54Viking@vikingmute在Arena设计测评中,Claude表现断崖式领先,GPT设计持续拉胯。作者推荐Qwen 3.7 Max,称其近期使用体验惊艳。分享工作流:利用design.md配合需求生成images2出图,再以图片为参考生成页面。Claude Design产品能帮助非设计师用户从技术细节中解脱,并提升视觉效果。技巧ClaudeQwen 3.7GPT设计工作流推荐理由:设计测评里Claude最强,不用它可以试试Qwen 3.7 Max。还有一套用design.md先出图再生成页面的工作流,挺实用。原文
16:52Fireworks AI@FireworksAI_HQFireworks AI 宣布其平台支持 Qwen 3.7 模型,并提供与 OpenAI 和 Anthropic 兼容的 API 端点。该服务可无缝集成到 Claude Code、Cursor、LangChain 等现有工具中。用户可立即使用无服务器版本,并申请 Qwen 3.7 Max 的早期访问。Fireworks AI 还提供定制工作负载支持。AI产品Qwen 3.7Fireworks AIAPI端点开源模型10 个信源在谈推荐理由:Fireworks 让 Qwen 3.7 即插即用原文
13:49IT之家(博客/媒体)阿里云峰会将于5月20日举行,千问大模型官方发布预热海报,暗示将推出“重量级新朋友”。海报关键词包括“更全能、更强大、有深度、有广度”,并出现Qwen吉祥物水豚。最新模型Qwen 3.7-Max-Preview和Qwen 3.7-Plus-Preview已上线测试平台,预计将在峰会正式发布。这标志着阿里在AI大模型领域的又一重要进展,值得关注。AI模型Qwen 3.7阿里云峰会大模型QwenAI模型发布推荐理由:Qwen 3.7 系列模型即将正式发布,关注国产大模型进展的开发者可以直接蹲峰会直播,看看新模型在推理和广度上到底提升了多少。原文