当前AI模型领域呈现开源加速、生态开放与垂直场景深耕三大趋势。阶跃星辰于2025年5月开源 Step 3.7 Flash 模型,推理速度最高达 400 Tokens/s,进一步降低开发者门槛(阶跃星辰开源 Step 3.7 Flash 模型,最高 400 Tokens/s)。阿里云同期发布全开放AI生态,允许直接访问 Qwen 及全球领先模型,并与模型巨头展开合作以强化生态布局(阿里云发布全开放AI生态,Qwen及全球领先模型可直接访问)。在模型即服务(MaaS)方面,Runway 推出 MCP 协议,可让 Claude、ChatGPT 等调用其视频生成能力,标志着模型间互操作性的新进展(Runway MCP 发布:连接 Claude、ChatGPT 等 AI 工具生成图像视频)。
模型训练的国产化与高效化成为热点:Model Best 开源的 BitCPM-CANN 方案实现了在国产芯片上进行 1.58-bit 训练,为减少对高端GPU依赖提供了可能(Model Best 开源 BitCPM-CANN:国产芯片实现 1.58-bit 训练)。同时,新的架构探索持续涌现,如循环层增强的掩码扩散语言模型 LoopMDM 在效率和性能上的提升(LoopMDM:循环层提升掩码扩散语言模型效率与性能)。
更具前瞻性的应用落地来自智能驾驶:小米汽车发布 Xiaomi Auto World Model,通过重建与生成一体化方法,在多项主流基准测试中达到最优水平(小米汽车发布 Xiaomi Auto World Model:重建+生成一体化,主流基准测试全面 SOTA)。此外,Qwen3.7-Max 在阿里云 Model Studio 上线并限时五折优惠,强调百万上下文窗口,为智能体场景提供支撑(Qwen3.7-Max 上线 Model Studio,百万上下文窗口限时五折)。
当前焦点在于模型如何更高效地适配垂直领域和硬件生态,同时通过开放协议与平台促进互操作。未来需关注:国产芯片上的模型训练能否规模化落地;模型即服务(MaaS)与传统API模式的竞争;以及世界模型在自动驾驶等场景的实用化程度。