Step 3.7 Flash

§ 01综述

Step 3.7 Flash 是阶跃星辰（StepFun）于2026年6月发布的一款196B参数的MoE（混合专家）模型，设计上从底层优先优化推理效率和成本，在速度、性能与端到端智能体任务中表现突出，成为当前开源模型效率竞赛的标杆之一。

Step 3.7 Flash 近期进展

物理竞赛胜出：在物理知识推理任务中，Step 3.7 Flash 击败了 DeepSeek V4-Flash，展现出在专业领域竞争力的同时，保持了更快的响应速度。原文标题

登顶AA综合性能榜：在2026年6月的AA（Agent Arena）排行榜上，Step 3.7 Flash 在速度、成本与端到端性能三个维度均位列第一，成为开发者部署智能体应用的首选模型之一。原文标题

生态集成加速：阶跃星辰官方宣布 Step 3.7 Flash 已部署到 Modal 平台，并配合 SGLang 提供 OpenAI 兼容接口，大幅降低了开发者将其集成至现有工具链的门槛。原文标题

KV-cache成本优化：该模型从设计之初就追求效率，通过压缩KV-cache使推理时的显存占用显著降低，在长上下文场景中尤为突出。原文标题

当前焦点与观察点

Step 3.7 Flash 的核心定位是“效率优先”，这与许多追求绝对性能的模型形成对比。它通过196B MoE架构在保持高质量输出的同时，将推理成本降至极具竞争力的水平。当前焦点集中于其在智能体（Agent）任务中的实际表现——例如将Agent Memory痕迹转化为本地检查工具、面向真实编程任务的演示等，均表明该模型更适合需要频繁调用、快速响应的应用场景。另一方面，有外部测评指出，Step 3.7 Flash 的输入和Fast Mode价格远低于Claude Fable 5，但在某些复杂任务上仍需平衡成本与输出质量。整体来看，Step 3.7 Flash 正在推动行业思考：智能是起点，效率才是落地的关键。

§ 02相关报道10 条在档

§ 03邻近话题