阶跃星辰近期发布并开源了其最新模型 Step 3.7 Flash,这是一款专为智能体(agent)场景设计的高效大语言模型。该模型采用混合专家(MoE)架构,总参数量达196B(另有报道称198B),但每次推理仅激活约11B参数,结合256K的超长上下文支持,在性能与效率之间取得了平衡。
- 主要进展包括:
- 阶跃星辰官方宣布发布Step 3.7 Flash,强调其为智能体效率而设计(阶跃星辰 Step 3.7 Flash 发布)。
- NVIDIA 在模型开源首日即提供全套加速支持,包括NIM推理微服务、NeMo框架定制以及GPU加速端点,彰显了生态的快速适配(NVIDIA 发布 Step 3.7 Flash)。
- 模型已在多个平台上线,如ZenMuxAI(Step 3.7 Flash 上线 ZenMuxAI)和OpenRouter(上线 OpenRouter),扩展了调用渠道。
- 据媒体报道,Step 3.7 Flash 推理速度最高可达400 tokens/s,凸显其高效性(IT之家)。
当前焦点在于,Step 3.7 Flash 如何通过极低的活跃参数比和产业级支持,成为代理型AI应用的基础模型。未来需观察其在真实智能体任务(如多步推理、工具调用)中的表现,以及开源社区对模型细化和二次开发的反响。