精选理由
Step 3.7 Flash 解决了智能体场景中速度与可靠性的平衡问题,做智能体开发、编码自动化和多模态应用的团队可以直接用开源权重部署,值得一试。
StepFun 发布了 Step 3.7 Flash 模型,这是一款面向智能体、编码、搜索和多模态工作流的高效模型。该模型采用 198B 稀疏 MoE 架构,仅激活约 11B 参数,支持 256K 上下文和三种推理级别,推理速度达 400 TPS。在 ClawEval-1.1、SimpleVQA Search 和 SWE-PRO 等基准测试中表现领先,并支持视觉理解、工具调用和本地运行。模型权重以 Apache 2.0 开源,可在 Mac Studio、DGX Spark 等设备上运行。
AI 翻译 · 中文
StepFun 发布了 Step 3.7 Flash 模型,这是一款面向智能体、编码、搜索和多模态工作流的高效模型。该模型采用 198B 稀疏 MoE 架构,仅激活约 11B 参数,支持 256K 上下文和三种推理级别,推理速度达 400 TPS。在 ClawEval-1.1、SimpleVQA Search 和 SWE-PRO 等基准测试中表现领先,并支持视觉理解、工具调用和本地运行。模型权重以 Apache 2.0 开源,可在 Mac Studio、DGX Spark 等设备上运行。
Read more in @StepFun_ai ’s launch post: StepFun @StepFun_ai ⚡️ Step 3.7 Flash is here: The new frontier is agent efficiency. #1 ClawEval-1.1 (67.1), #1 SimpleVQA Search (79.2), #2 SWE-PRO (56.3), 95.3 on V* Python. Open…