阶跃星辰 Step 3.7 Flash 发布:专为智能体效率打造

⚡️ Step 3.7 Flash is here: The new frontier is age…

精选理由

做智能体、编程或搜索应用的开发者终于有了一个兼顾速度、成本和可靠性的开源模型——Step 3.7 Flash 在工具调用和视觉理解上表现突出,而且能在本地跑,建议直接试试。

AI 摘要

阶跃星辰发布了 Step 3.7 Flash 模型,专注于智能体效率,在 ClawEval-1.1、SimpleVQA Search 等基准测试中取得领先成绩。该模型采用 198B 稀疏 MoE 架构,约 11B 活跃参数,支持 400 TPS 推理速度和 256K 上下文,并提供三种推理级别。它擅长理解 UI、图表、文档和图像,并能直接编写代码或调用工具执行操作,在 τ²-bench 上工具调用可靠性超过 98%。模型权重以 Apache 2.0 开源,可在 Mac Studio M4 Max、DGX Spark 等设备本地运行,并兼容 Claude Code、MCP 等生态。

AI 翻译 · 中文

阶跃星辰发布了 Step 3.7 Flash 模型,专注于智能体效率,在 ClawEval-1.1、SimpleVQA Search 等基准测试中取得领先成绩。该模型采用 198B 稀疏 MoE 架构,约 11B 活跃参数,支持 400 TPS 推理速度和 256K 上下文,并提供三种推理级别。它擅长理解 UI、图表、文档和图像,并能直接编写代码或调用工具执行操作,在 τ²-bench 上工具调用可靠性超过 98%。模型权重以 Apache 2.0 开源,可在 Mac Studio M4 Max、DGX Spark 等设备本地运行,并兼容 Claude Code、MCP 等生态。

阶跃星辰 Stepfun⚡️ Step 3.7 Flash is here: The new frontier is agent efficiency. #1 ClawEval-1.1 (67.1), #1 SimpleVQA Search (79.2), #2 SWE-PRO (56.3), 95.3 on V* Python. Open weights under Apache 2.0. Built for agentic, coding, search,