qwen3·general

Qwen3

别名
首次出现
2026-05-22
最近出现
2026-06-10
累计提及
222
§ 01综述

通义千问 Qwen 系列近期密集发布新模型与工具,展现了在性能、推理速度和任务能力上的持续突破。Qwen3.7-Max 模型在第三方评测中表现抢眼:登顶 OpenRouter 趋势榜,使用量达 77.3B tokens(Qwen3.7-Max登顶OpenRouter趋势榜);同时在 ITBench-AA 企业 IT 任务评测中位列第三,其处理企业级复杂任务的能力获得认可(Qwen3.7-Max 登顶 ITbench-AA 第三)。此外,阿里云基于 Qwen3.7-Max 与 NousResearch 合作推出了 Hermes Agent,探索智能体应用(阿里云用Qwen3.7-Max驱动Hermes Agent)。在推理效率方面,Qwen3.5 借助 TokenSpeed 引擎实现了 580 tps 的推理速度,创下记录(Qwen3.5 达 580 tps)。值得注意的是,英伟达开源了 Polar 框架,该框架支持对包括 Qwen Code 在内的代码模型进行 GRPO 训练,显著提升了 Codex 跑分(英伟达开源 Polar 框架),这表明 Qwen 模型正被生态工具广泛采纳。当前焦点在于 Qwen 系列在模型能力、推理速度和生态集成上的多线推进,未来可关注其混合专家架构(MoE)的进一步优化以及与企业应用的深度融合。

§ 02相关报道10 条在档
  1. 01
    LoRA+NEFTune 微调 DeepSeek-R1-8B 金融 NER 达 0.912 F1
    arXiv: DeepSeek
  2. 02
    SpatialWorld:多模态智能体交互式空间推理新基准
    arXiv cs.AI
  3. 03
    Code Is More Than Text:面向代码生成的不确定性估计新方法
    arXiv cs.LG
  4. 04
    阿里合并通义大模型事业部,成立Token Foundry,周靖人任首席科学家
    IT之家
  5. 05
    DACSI攻击:低成本间接提示注入突破RAG安全边界
    arXiv: DeepSeek
  6. 06
    Qwen3.7-Max 实测:Claude+Qwen 组合效果超 GPT5.5,成本不到 10 元
    宝玉
  7. 07
    开源语音模型 Audio Interaction 每 0.4 秒决定是否说话
    Decoder
  8. 08
    Qwen3.7-Plus:阿里将多模态AI变成自主智能体
    Decoder
  9. 09
    Anthropic 80%新代码由Claude生成,Google Gemma 4 12B本地运行
    rohanpaul_ai
  10. 10
    SETA:稀疏子空间专家共享解决LLM持续学习灾难性遗忘
    arXiv cs.AI
§ 03邻近话题

本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

/topic/Qwen3