全部 AI 动态 · AI 热点

6月9日

10:29

arXiv: DeepSeek@Jianguo Zhu

精选

研究者发现了一种针对检索增强生成（RAG）系统的新型间接提示注入攻击模式，称为DACSI（文档作者控制信号冒充）。攻击者通过编写看似元数据、来源或策略信号的文档文本，让模型误将其视为可信的控制指令，从而绕过安全边界。该攻击无需显式命令，利用RAG将用户查询、检索文档和系统标签混合到同一自然语言提示中的设计缺陷。在DeepSeek V4 Pro、Qwen3.5-397B等6种模型上的实验表明，该攻击在多数模型上有效，尤其在高易感性设置中。研究建议通过源/通道分离来缓解此类攻击。

论文 RAG 提示注入安全攻击 DeepSeek Qwen

推荐理由：RAG系统开发者需要警惕这种低成本、隐蔽的间接注入方式——它不依赖命令，而是冒充元数据，做AI安全的团队建议仔细看论文中的缓解方案。

原文

6月6日

05:16

lmarena.ai@lmarena_ai

AI模型文生图开源模型 Ideogram Hunyuan Qwen

推荐理由：开源文生图模型的排名变化直接反映技术趋势，做图像生成应用或研究的人可以据此选择模型，值得关注 Ideogram 和 Hunyuan 的最新进展。

原文

6月4日

23:26

SiliconFlowAI@siliconflowai

Nex 团队推出 Nex-N2-Pro 模型，基于 Qwen3.5-397B-A17B，在多项基准测试中达到 GPT-5.5 和 Claude Opus 4.7 级别性能。该模型为 397B MoE 推理模型，支持 262K 上下文和视觉语言任务，能自动调整推理深度，减少 30-50% 的思考 token 而不牺牲性能。在 Terminal Bench 2.1、GDPVal 和 SWE-Verified 上取得 SOTA 成绩，擅长智能体编程、深度搜索和工具使用。SiliconFlow 已提供 T+0 支持，前两周免费使用。

AI模型推理模型 MoE 开源/仓库智能体编程 Qwen

推荐理由：做智能体编程或深度搜索的团队，现在就能免费试用一个对标顶级闭源模型的开源 MoE 模型，且能直接接入 Claude Code、Cursor 等工具，值得立即体验。

原文

6月2日

10:58

阿里通义 Qwen@Alibaba_Qwen

阿里 Qwen 团队在 Twitter 上展示了 Demo2，一个多模态交互混合智能体。该智能体能够处理文本、图像等多种输入，实现更自然的交互体验。Demo2 展示了多模态理解和生成能力，标志着 AI 智能体在多模态交互方面的新进展。这一技术有望应用于更复杂的任务场景，提升人机协作效率。

AI产品 Qwen 多模态智能体交互阿里

推荐理由：多模态交互是 AI 智能体的关键方向，Qwen 的 Demo2 展示了更自然的交互方式，做多模态应用或智能体开发的团队值得一看。

原文

10:58

阿里通义 Qwen@Alibaba_Qwen

阿里巴巴 Qwen 团队在 Twitter 上发布了第三个演示 Demo3，展示其 Browser Agent 能力。该 Agent 能够自主操作浏览器，执行网页任务。视频演示了 Agent 如何理解用户指令并完成浏览器交互。这一进展表明 Qwen 在智能体领域持续推进，为自动化浏览器操作提供了新方案。目前该推文获得 32 个点赞和 8174 次查看。

AI产品 Qwen Browser Agent 智能体浏览器自动化演示

推荐理由：做浏览器自动化和智能体开发的团队值得关注——Qwen 的 Browser Agent 展示了端到端操作能力，可以直接参考其实现思路。

原文

09:51

Julien Chaumond@julien_c

精选

阿里巴巴 Qwen 团队发布 Qwen3.7-Plus，一个多模态智能体模型，统一了视觉和语言能力。该模型支持多模态交互式混合智能体，可同时处理 GUI 和 CLI 操作，具备视觉感知、推理、定位和搜索增强问答能力。它还能作为全能编码助手和生产力工具，接受全模态输入。Qwen3.7-Plus 现已通过阿里云模型服务 API 提供，开发者可直接尝试。

AI模型 Qwen 多模态智能体开源/仓库阿里云

推荐理由：多模态智能体模型将视觉与语言统一，做自动化操作和智能体开发的团队可以直接用 API 试，省去自己拼接多模型的工作。

原文

01:54

阿里通义 Qwen@Alibaba_Qwen

精选

Qwen3.7-Plus在文本基准测试中展现出竞争力，整体表现逼近Max级别模型。该结果来自Qwen官方发布的性能1测试。目前尚无具体基准和分数细节。

AI模型 Qwen3.7-Plus Qwen Alibaba 文本基准

推荐理由：Qwen新模型性能追平高端

原文

5月30日

12:34

orange.ai@oran_ge

有投资人爆料称 Anthropic 的 Claude 模型蒸馏了中国模型 Kimi 和 Qwen，而非此前猜测的 Cursor。该说法最初在私下交流中传出，如今似乎有更多证据浮出水面。事件折射出 AI 行业模型蒸馏现象的普遍性与真假难辨的现状。作者调侃称责任全在崔茂。

行业 Anthropic Claude 蒸馏 Kimi Qwen

推荐理由：模型蒸馏争议触及 AI 行业的核心竞争与伦理问题，关注大模型生态的从业者和投资人值得一读，看完会对行业潜规则有新认识。

原文

5月29日

17:11

阿里云 Alibaba Cloud@alibaba_cloud

阿里云联合Appnovation举办线上战略简报，探讨Qwen模型如何帮助企业重新思考AI性能与成本的平衡。简报将分享全球领导者选择Qwen的原因，以及团队保持竞争力所需的关键信息。活动定于6月9日周二上午11点（太平洋时间）举行，时长55分钟，需注册参与。

行业 Qwen 阿里云 AI成本企业AI 战略简报

推荐理由：正在评估AI模型性价比的企业团队，可以直接了解Qwen在性能与成本上的实际表现，建议注册参加简报获取一手信息。

原文

5月28日

23:27

berryxia@berryxia

72°

Qwen团队推出新基准Qwen-Image-Bench，将文本到图像（T2I）评测从简单的提示词对齐提升到真实世界保真度和创意生成能力。该基准包含56个细粒度评估维度，并配备Q-Judger自动评分器，与人类判断的相关性高达ρ=0.92。测试显示，OpenAI、Gemini、Grok、Flux等现有模型的排名被重新洗牌，差距明显。开发者、Prompt工程师和企业可用此基准评估模型、优化提示词或选择供应商。Qwen此举不仅自卷模型，还推动了评测标准的进步。

AI产品 Qwen T2I评测 Qwen-Image-Bench 创意生成模型评估

推荐理由：做T2I模型开发或选型的团队，终于有了一个能区分真实创意能力的评测标准，不再只看基础对齐分，建议直接拿自己的pipeline跑一遍，数据会说话。

原文

5月27日

22:11

阿里云 Alibaba Cloud@alibaba_cloud

在2026年Qwen大会上，阿里云宣布推出完全开放的AI生态系统。除了自家的Qwen系列模型，全球领先的第三方模型现在也可以通过Model Studio和百炼平台直接访问。这一举措旨在打破模型孤岛，为开发者提供更丰富的模型选择。阿里云通过开放生态，降低了AI应用的门槛，加速了AI技术的普及和创新。

AI产品阿里云 Qwen 开放生态模型市场 AI平台

推荐理由：阿里云开放生态让开发者无需切换平台就能调用全球顶尖模型，做AI应用集成的团队可以大幅减少对接成本，建议直接体验Model Studio的模型市场。

原文

5月26日

16:35

阿里云 Alibaba Cloud@alibaba_cloud

阿里巴巴云发布 AI Key Frames 系列，首期邀请 Nous Research 战略主管 Tommy Eastman 探讨 AI 智能体的本质。Eastman 指出当前多数“AI 智能体”只是带额外步骤的聊天机器人，真正的智能体应具备自主决策能力。他强调开源模型在持续超越闭源实验室，并预测 AI 将成为一切的操作层。该系列旨在推动 AI 原生发展，值得关注。

AI产品智能体开源/仓库 Qwen AI 原生行业趋势

推荐理由：Tommy Eastman 对 AI 智能体的犀利定义直击行业痛点，做智能体开发的团队和关注开源 vs 闭源趋势的读者，看完会对 AI 的未来方向有更清晰判断。

原文

15:36

阿里云 Alibaba Cloud@alibaba_cloud

在2026年Qwen大会上，阿里云CTO兼国际业务总裁李飞飞博士宣布公司战略从云原生转向智能体原生。为普及AI，阿里云构建了四大基石：模型、智能体云、工具与服务、规模化。这一转变标志着阿里云将AI智能体作为核心基础设施，推动AI的民主化应用。

行业阿里云智能体云原生 AI民主化 Qwen

推荐理由：阿里云的战略转向Agent-native，做云服务和AI应用的团队值得关注——这直接决定了未来云架构和开发范式的走向。

原文

14:28

阿里云 Alibaba Cloud@alibaba_cloud

阿里云宣布将于Qwen Conference 2026举办AI Key Frames直播活动，聚焦AI生产力核心、全栈AI重塑增长曲线。活动将邀请行业先锋探讨推理、内容创作和开放AI生态等前沿领域。直播旨在帮助观众深入理解AI原生趋势，并推动AI应用落地。用户可通过链接预约观看。

行业阿里云 Qwen AI大会推理模型内容创作

推荐理由：阿里云Qwen大会首次以直播形式拆解AI生产力核心，做AI应用或关注推理、内容创作的开发者值得预约，能直接获取行业先锋的一手洞察。

原文

12:13

阿里云 Alibaba Cloud@alibaba_cloud

Picsart 与阿里巴巴的 Qwen 模型及 HappyHorse 合作，发起 Picsart HappyHorse Awards，这是一项面向创意人士的 AI 视频挑战赛。参赛者需使用 Picsart 和 HappyHorse 工具创作 15 秒至 5 分钟的竖屏短视频，主题涵盖电影感、情感、戏剧或实验风格。大奖为 5000 美元现金或前往阿姆斯特丹 HumanX 的旅行，另有多个荣誉奖。挑战赛从 5 月 26 日持续到 6 月 14 日，获奖者于 7 月 3 日公布。这为 AI 创作者提供了展示才华和赢取奖励的绝佳机会。

行业 AI视频创作挑战 Picsart Qwen HappyHorse

推荐理由：AI 视频创作者和内容制作者可以借此机会展示创意，赢取现金或旅行大奖，同时获得 Picsart 的官方推广曝光，值得一试。

原文

11:48

arXiv cs.AI@Federico Torrielli, Peter Schneider-Kamp, Lukas Galke Poech

精选

该研究针对激活预言机（activation oracles）的自然语言输出，探索了6种不确定性量化方法。实验基于6000个样本，发现bootstrap模式频率在Qwen3-8B和Qwen3.6-27B上校准误差最低（ECE 5.7% vs 25.5%），而log-prob基线可作为低成本快速筛选信号。这项工作填补了激活预言机置信度评估的空白，对依赖模型内部解释的AI安全研究有直接意义。

论文激活预言机置信度校准不确定性量化模型可解释性 Qwen

推荐理由：做模型可解释性研究的团队终于有了可靠的置信度评估方法——bootstrap模式频率比传统log-prob校准误差低近5倍，建议做LLM内部机制分析的开发者直接参考论文代码。

原文

5月25日

20:56

阿里云 Alibaba Cloud@alibaba_cloud

在 Qwen Conference 2026 上，Fizzdragon CEO Pax Chen 参加了基础模型论坛，分享了 AI 如何将影视、广告和创意内容的制作从脚本到屏幕缩短至几分钟。他解析了 AI 驱动的创意工作流的下一个前沿，展示了 AI 原生时代的创作动能。这场讨论揭示了 AI 在内容生成领域的实际应用潜力，尤其对影视和广告行业具有变革意义。

行业 AI 创意影视制作广告 Qwen 工作流

推荐理由：影视和广告从业者终于有了可落地的 AI 工作流——从脚本到成片只需几分钟，做创意内容的人建议关注这个方向。

原文

20:56

阿里云 Alibaba Cloud@alibaba_cloud

在Qwen Conference 2026上，行业领袖和生态先驱在基础模型论坛中围绕“Qwen的多模态未来”展开圆桌讨论。他们探讨了驱动跨模态对齐的架构变革，并深入分析了AI原生趋势。会议旨在揭示多模态AI的最新进展和未来方向。活动详情可通过链接获取。

行业多模态 Qwen 架构变革 AI原生圆桌讨论

推荐理由：关注多模态AI架构演进的开发者，这场圆桌讨论能帮你理解跨模态对齐的核心技术趋势，值得一看。

原文

20:22

阿里云 Alibaba Cloud@alibaba_cloud

在 Qwen Conference 2026 上，Kara Tech 的 CEO Arash Tayebi 参与了基础模型论坛，讨论了 AI 如何超越字幕，推动数字包容的新前沿。会议聚焦于 AI 原生技术如何为残障人士和语言障碍群体提供更平等的数字体验。该论坛强调了 AI 在实时翻译、无障碍交互等方面的潜力，标志着数字包容从辅助功能向核心体验的转变。活动还预告了更多 AI 原生应用的发布，值得关注。

行业数字包容 AI 原生无障碍实时翻译 Qwen

推荐理由：数字包容是 AI 落地的关键社会价值场景，做无障碍产品、多语言服务的团队可以关注 AI 如何从字幕走向更深层的交互平等。

原文

20:22

阿里云 Alibaba Cloud@alibaba_cloud

精选

在 2026 年 Qwen 大会上，NVIDIA 高级解决方案架构师 Jian Zhai 在基础模型论坛上深入解析了 Qwen 推理优化技术，展示了通过 NVIDIA 全栈加速实现的突破性性能提升。该演讲聚焦于如何利用 NVIDIA 的软硬件协同优化，显著降低 Qwen 模型的推理延迟并提高吞吐量，为 AI 应用落地提供关键支持。这一合作体现了 AI 原生生态的快速发展，对部署 Qwen 模型的开发者和企业具有重要参考价值。

AI模型 Qwen NVIDIA 推理优化全栈加速 AI 原生

推荐理由：NVIDIA 全栈加速让 Qwen 推理性能实现突破，做模型部署和推理优化的工程师可以直接参考其技术方案，值得关注。

原文

19:48

阿里云 Alibaba Cloud@alibaba_cloud

在Qwen Conference 2026上，英特尔高级云解决方案架构师Jian Zhang在Agent原生云论坛中，讨论了如何利用Intel Xeon处理器构建AI Agent基础设施，强调其快速、可靠且成本高效的特点。该演讲旨在推动AI原生应用的落地，为开发者提供更优的硬件支持方案。

行业 AI Agent 基础设施 Intel Xeon 云原生 Qwen

推荐理由：做AI Agent部署的团队可以关注Intel Xeon在成本和可靠性上的优势，值得点开了解如何优化基础设施。

原文

18:40

阿里云 Alibaba Cloud@alibaba_cloud

在 Qwen 2026 大会上，AMD 大中华区销售副总裁 Junjie Zhou 在代理应用论坛发表演讲，主题为“推进 AI，引领未来”。他探讨了 AI 原生时代的趋势与机遇，强调 AMD 与阿里云在 AI 领域的合作。该演讲旨在展示如何利用 AI 代理技术推动企业创新。大会聚焦 AI 代理的实际应用，为开发者与企业提供前沿洞察。

行业 AI 代理 AMD Qwen 阿里云行业合作

推荐理由：AMD 高管亲自站台 Qwen 大会，说明 AI 代理在硬件-软件协同中的重要性，做 AI 应用或云服务的团队值得关注这一合作方向。

原文

16:24

阿里云 Alibaba Cloud@alibaba_cloud

阿里云宣布举办Qwen Live活动，主题为“通往AI原生之路”。活动将直播发布最新突破，直接向观众展示未来创新。用户可通过链接观看直播，了解Qwen系列的最新进展。这标志着阿里云在AI原生领域的持续投入和布局。

AI产品 Qwen 阿里云 AI原生直播模型发布

推荐理由：关注阿里云Qwen系列最新动态的开发者，可以直接观看直播，第一时间了解AI原生方向上的关键突破。

原文

13:34

阿里云 Alibaba Cloud@alibaba_cloud

阿里云CTO李飞飞与Nous Research战略主管Tommy Eastman将在2026年5月26日的Qwen Conference上讨论“Scaling Trustworthy Agents”（扩展可信智能体）。该对话聚焦于如何构建可信任的AI智能体，以推动AI原生应用的规模化发展。会议旨在探讨智能体在复杂场景中的可靠性、安全性和可扩展性。这是AI行业从模型能力向智能体落地转型的关键议题。

行业智能体可信AI Qwen 阿里云 Nous Research

推荐理由：智能体信任问题是当前AI落地的最大瓶颈之一，做AI应用开发或智能体部署的团队值得关注这场对话，了解行业头部玩家如何解决规模化中的信任挑战。

原文

11:16

arXiv cs.AI@Stuart Bladon, Brinnae Bent

精选76°

一项新研究挑战了普遍假设，发现大语言模型的地缘政治偏见主要来自后训练阶段（如指令微调），而非预训练数据。研究测试了七个开源模型对（基础版和聊天版）在28对国家上的偏好，结果显示六家实验室的模型在后训练后表现出与开发者所在国或地区一致的偏见。例如，阿里Qwen 2.5聊天版对中国偏好从基础版的-0.15跃升至+2.91（对数几率），变化达18倍。偏见强度还受提示语言影响：法国Mistral模型仅在法语提示下才显著亲法。该发现强调了对模型对齐过程进行透明审计和监督的必要性。

论文地缘政治偏见后训练对齐模型审计 Qwen Mistral

推荐理由：这项研究戳破了“数据决定一切”的迷思，做AI安全、模型对齐或地缘政治分析的团队值得细读——它直接影响了如何评估和调整模型的政治倾向。

原文

5月23日

16:19

@atomic_chat_hq@atomic_chat_hq

精选72°

Atomic Chat 团队通过 Multi-Token Prediction (MTP) 技术，在 2 块 RTX 5090 上对 Qwen 模型实现了最高 2.5 倍的推理加速。其中，Qwen3.6 27B 密集模型从 51 tps 提升至 117 tps（+137%），而 MoE 模型 35B-A3B 从 218 tps 提升至 267 tps（+25%）。MTP 通过一次前向传播验证多个预测 token，显著减少了内存带宽瓶颈，密集模型受益更大。该技术保持零精度损失，仅需额外约 1 GB 显存，且代码已开源。

AI模型推理加速 MTP/多token预测 Qwen MoE/密集模型开源/仓库

推荐理由：MTP 技术让本地大模型推理速度翻倍，尤其适合在消费级显卡上跑密集模型的开发者——2 块 RTX 5090 就能让 27B 模型达到 117 tps，值得直接试开源代码。

原文

5月22日

16:36

阿里云 Alibaba Cloud@alibaba_cloud

阿里云宣布将于2026年在新加坡金沙会展中心举办Qwen Conference，聚焦基础模型论坛。论坛将探讨预训练突破、推理逻辑和未来模型路线图等核心智能领域的前沿进展。该活动旨在为AI研究者和开发者提供深度交流平台，展示通义千问系列模型的最新成果。目前会议已开放报名，感兴趣者可提前锁定席位。

AI产品 Qwen 基础模型预训练推理逻辑会议

推荐理由：Qwen Conference 是了解通义千问最新技术路线和预训练突破的窗口，做基础模型研究或应用的开发者值得关注，建议提前报名锁定席位。

原文

16:05

阿里云 Alibaba Cloud@alibaba_cloud

阿里云在 Qwen Conference 2026 上举办 Agent-Native Infra Forum，聚焦为自主智能体重新设计云堆栈。论坛将探讨专为智能体优化的硬件、内存和扩展基础设施。该活动在新加坡金沙会展中心举行，旨在解决当前云架构无法满足智能体高并发、低延迟需求的问题。对于构建复杂 AI 系统的开发者来说，这是了解下一代基础设施方向的重要机会。

行业智能体云基础设施阿里云 Qwen 行业会议

推荐理由：阿里云这次把智能体基础设施单独拎出来讲，说明云厂商开始认真对待 Agent 的规模化部署问题了。做 Agent 应用或平台开发的团队，这场论坛的内容可能直接影响你未来选云和架构设计，值得关注。

原文

08:06

OpenRouter@OpenRouterAI

OpenRouter 发布了一篇指南，详细介绍了如何在使用 Qwen 模型时启用显式缓存功能。显式缓存可以显著减少重复请求的响应时间，降低 API 调用成本，尤其适合需要频繁调用相同上下文的场景。指南涵盖了缓存配置、使用方法和最佳实践，帮助开发者更高效地利用 Qwen 模型。这对于依赖 Qwen 进行对话、推理或内容生成的团队来说是一个实用的优化技巧。

技巧 Qwen 显式缓存 API优化 OpenRouter 教程

推荐理由：Qwen 用户终于有了官方缓存指南——显式缓存能省下大量重复请求的时间和费用，做对话或推理应用的团队建议直接照着配置。

原文

5月21日

22:14

阿里通义 Qwen@Alibaba_Qwen

83°

阿里巴巴 Qwen 团队展示了一项令人瞩目的成果：模型在约 35 小时的连续自主执行中，独立完成了 432 次内核评估和 1158 次工具调用。它自行编写、编译、分析并迭代优化了 Extend Attention Kernel，最终在多个工作负载上实现了相对于 Triton 参考实现的 10.0 倍几何平均加速。这标志着模型具备了真正的自主编程与优化能力，无需人类干预即可完成复杂系统级任务。

AI模型 Qwen 自主进化内核优化 AI 编程性能加速

推荐理由：这是 AI 自主编程能力的里程碑——模型不再只是写代码，而是能像资深工程师一样分析、调优、迭代。做 AI 系统优化或关注模型自主性的开发者，值得仔细看看这个案例。

原文

12:39

rohanpaul_ai@rohanpaul_ai

精选76°

atomic.chat 展示了 Multi-Token Prediction（MTP）技术，让本地运行的 Qwen 27B 密集模型从 51 tokens/s 提升到 117 tokens/s，MoE 35B-A3B 模型在 2x RTX 5090 上从 218 提升到 267 tokens/s。MTP 通过一次生成并验证多个未来 token，减少 GPU 重复读取模型权重的次数，从而突破内存带宽瓶颈。测试中约 80% 的 draft token 被接受，且零精度损失，仅额外占用约 1GB VRAM。该项目完全开源，对本地大模型部署者是个重大利好。

AI模型本地大模型 MTP/多 token 预测推理加速 Qwen 开源/仓库

推荐理由：本地大模型用户终于可以突破内存带宽瓶颈了——MTP 让 Qwen 27B 速度翻倍还零精度损失，跑本地模型的开发者建议直接去 GitHub 试。

原文

12:09

arXiv cs.LG@Zhepei Wei, Xinyu Zhu, Wei-Lin Chen, Chengsong Huang, Jiaxin Huang, Yu Meng

精选76°

研究发现强化学习（RLVR）训练中模型权重的变化轨迹是低秩且高度可预测的，大部分性能提升来自秩-1近似。基于此，研究者提出RELEX方法，仅需观察少量训练步数（如50步），通过线性回归外推未来检查点（如1000步），即可匹配甚至超越完整RLVR训练的性能。在Qwen2.5-Math-1.5B、Qwen3-4B-Base和Qwen3-8B-Base三个模型上验证，RELEX仅需15%的训练步数即可达到同等效果，且能外推至10-20倍于观察窗口。该方法无需额外学习模型，通过丢弃随机优化噪声实现去噪效果，从而提升外推性能。

论文强化学习推理模型低秩近似参数外推 Qwen

推荐理由：RLVR训练成本高昂，RELEX用极低成本实现同等推理提升，做LLM推理优化的团队可以直接用代码复现，值得一试。

原文

08:00

elvis@omarsar0

Omar 展示了如何利用 Fireworks AI Agent 自动化 LLM 的后训练微调过程。他通过 Claude Code 与 Fireworks Agent 交互，用自然语言指令微调一个小型 Qwen 模型，使其输出风格适配 PaperWiki 项目。这标志着 AI 系统自我改进的初步探索，未来目标是让模型能递归地自我优化，用于知识发现和端到端研究自动化。

AI产品自我改进微调自动化 Fireworks Agent Qwen PaperWiki

推荐理由：Omar 把 AI 自我改进从概念变成了可实操的流程——用 Fireworks Agent 自动微调模型，做知识管理或研究自动化的团队可以直接复现，省去手动调参的麻烦。

原文

5月19日

13:49

13:49IT之家（博客/媒体）

阿里云峰会将于5月20日举行，千问大模型官方发布预热海报，暗示将推出“重量级新朋友”。海报关键词包括“更全能、更强大、有深度、有广度”，并出现Qwen吉祥物水豚。最新模型Qwen 3.7-Max-Preview和Qwen 3.7-Plus-Preview已上线测试平台，预计将在峰会正式发布。这标志着阿里在AI大模型领域的又一重要进展，值得关注。

AI模型 Qwen 3.7 阿里云峰会大模型 Qwen AI模型发布

推荐理由：Qwen 3.7 系列模型即将正式发布，关注国产大模型进展的开发者可以直接蹲峰会直播，看看新模型在推理和广度上到底提升了多少。

原文

12:01

Geek@geekbb

72°

阿里巴巴通义千问团队发布了 Qwen 3.7 预览版，包括 Max 和 Plus 两个版本，已在 LMSYS Arena 上线。该模型在文本和视觉任务上表现强劲，使阿里在 Arena 文本榜单升至第6、视觉榜单升至第5。官方表示完整系列模型即将发布，值得期待。

AI模型 Qwen Arena 多模态文本生成阿里

推荐理由：Qwen 3.7 预览版在 Arena 上表现亮眼，阿里排名大幅提升，做多模态或文本生成的应用开发者可以关注后续正式版发布。

原文

5月15日

10:10

arXiv: DeepSeek@Libo Sun, Po-wei Harn, Peixiong He, Xiao Qin

精选

该研究系统评估了七种KV缓存压缩机制在数学推理任务上的表现，发现所有现有方法在小预算下均被拒绝。作者提出一种名为α的简单修改，通过引入多样性惩罚项替代传统argmax-top-k选择，在Qwen-7B和Llama-8B模型上，在64和128预算下，α在两项测试中显著优于基线。该发现表明，最小化的评分修改比复杂的结构重设计更有效，且严格的实验协议使这一不对称性得以显现。

论文 KV缓存压缩推理模型数学推理 Qwen Llama

推荐理由：KV缓存压缩是长上下文推理的关键瓶颈，做LLM推理优化的开发者可以直接参考α方法——它用一行修改就打败了七种复杂方案，值得在自家模型上试试。

原文

5月14日

01:10

阿里云 Alibaba Cloud@alibaba_cloud

阿里云将在VivaTech大会上举办AInnovation峰会，展示其AI技术如何驱动实际商业价值。峰会将重点介绍Qwen、Wan、HappyHorse和HappyOyster等AI产品。活动将于6月17日15:00 CEST在巴黎凡尔赛门展览中心举行。这为关注企业级AI应用的从业者提供了了解最新技术和案例的机会。

行业阿里云 Qwen VivaTech 企业AI 行业峰会

推荐理由：想了解阿里云AI产品如何落地商业场景的从业者，可以关注这场峰会，直接获取Qwen等模型的实际应用案例。

原文

5月13日

19:15

Clement Delangue@ClementDelangue

Hugging Face CEO Clement Delangue在特朗普与习近平会晤期间，呼吁美国AI社区公开支持开源国际AI，特别是来自中国的Deepseek、Qwen、Kimi、GLM等模型。他强调开源是当前AI领域竞争、就业和财富创造的最重要驱动力。此举意在关键时刻维护开源合作，避免地缘政治影响技术交流。

行业开源/仓库 Deepseek Qwen Kimi GLM

推荐理由：开源AI社区正面临地缘政治压力，Hugging Face CEO的呼吁提醒从业者：支持开源模型（尤其是中国模型）关乎整个行业的竞争力和创新活力。做AI开发或关注开源生态的人，值得关注这一立场。

原文

15:51

阿里云 Alibaba Cloud@alibaba_cloud

阿里云宣布 Qwen Conference 2026 将于5月26日在新加坡滨海湾金沙会展中心举办，现已开放注册。大会将覆盖从基础模型到 AI 编程实践的全栈内容，展示通义千问系列的最新进展。这是开发者近距离了解 Qwen 生态、体验前沿 AI 能力的机会。

行业 Qwen 阿里云 AI 大会通义千问新加坡

推荐理由：Qwen 生态的年度大会首次落地海外，做 AI 应用开发或关注开源大模型的团队值得关注，可以直接注册参会。

原文

5月12日

21:55

AK@_akhaliq

阿里发布Qwen-Image-2.0技术报告，介绍了新一代多模态图像生成模型。该模型在文本到图像生成、图像编辑和风格迁移等任务上表现出色，支持高分辨率输出和细粒度控制。报告详细阐述了模型架构、训练方法和性能评估，表明其在多项基准测试中达到领先水平。这对于推动多模态AI发展和实际应用具有重要意义。

论文多模态图像生成 Qwen 技术报告

推荐理由：Qwen-Image-2.0的发布展示了阿里在多模态生成领域的持续进步，为图像生成任务提供了新的基准和工具，值得相关从业者关注。

原文