Step 3.7 Flash 上线 Fireworks AI,速度达 400 tokens/s

Great to see Step 3.7 Flash live on @FireworksAI_H…

精选理由

Step 3.7 Flash 以 400 tokens/s 的速度刷新了推理效率,做实时 AI 应用或智能体开发的团队可以直接在 Fireworks AI 上试用,省去自建推理基础设施的麻烦。

AI 摘要

阶跃星辰的 Step 3.7 Flash 模型已在 Fireworks AI 平台上线。该模型从设计之初就针对推理优化,采用硬件友好的架构和 MTP 辅助解码技术,推理速度可达每秒 400 tokens。Step 3.7 Flash 支持多模态输入,适合在真实工作流中驱动智能体。这一发布为开发者提供了高性能、低延迟的模型选择,尤其适合需要快速响应的应用场景。

AI 翻译 · 中文

阶跃星辰的 Step 3.7 Flash 模型已在 Fireworks AI 平台上线。该模型从设计之初就针对推理优化,采用硬件友好的架构和 MTP 辅助解码技术,推理速度可达每秒 400 tokens。Step 3.7 Flash 支持多模态输入,适合在真实工作流中驱动智能体。这一发布为开发者提供了高性能、低延迟的模型选择,尤其适合需要快速响应的应用场景。

阶跃星辰 StepfunGreat to see Step 3.7 Flash live on @FireworksAI_HQ. Designed for inference from day one, Step 3.7 Flash combines a hardware-friendly architecture with MTP-assisted decoding to reach up to 400 tokens/s. Fast, multimodal,