AI模型精选

Step 3.7 Flash:400+ tokens/s 开源推理模型

Thanks @ArtificialAnlys for the detailed independe…

精选理由

做智能体应用或需要高吞吐推理的团队,Step 3.7 Flash 的开源高速度方案值得直接拿来用,尤其适合生产环境部署。

AI 摘要

StepFun 发布 Step 3.7 Flash 模型,主打高智能与高速度的平衡。该模型采用 MTP 辅助解码技术,输出速度超过 400 tokens/s,具备更强的智能体性能和原生多模态能力。模型权重以 Apache 2.0 协议开源,适合生产级智能体工作负载。独立评测者 @ArtificialAnlys 对其进行了详细评估。

AI 翻译 · 中文

StepFun 发布 Step 3.7 Flash 模型,主打高智能与高速度的平衡。该模型采用 MTP 辅助解码技术,输出速度超过 400 tokens/s,具备更强的智能体性能和原生多模态能力。模型权重以 Apache 2.0 协议开源,适合生产级智能体工作负载。独立评测者 @ArtificialAnlys 对其进行了详细评估。

阶跃星辰 StepfunThanks @ArtificialAnlys for the detailed independent evaluation. Step 3.7 Flash is built with a clear focus on the intelligence-speed frontier: MTP-assisted decoding, 400+ output tokens/s, stronger agentic performance, n