23:01阶跃星辰 Stepfun@Stepfun_AI阶跃星辰的 Step 3.7 Flash 模型已在 Fireworks AI 平台上线。该模型从设计之初就针对推理优化,采用硬件友好的架构和 MTP 辅助解码技术,推理速度可达每秒 400 tokens。Step 3.7 Flash 支持多模态输入,适合在真实工作流中驱动智能体。这一发布为开发者提供了高性能、低延迟的模型选择,尤其适合需要快速响应的应用场景。AI模型推理模型多模态阶跃星辰Fireworks AI智能体1 个信源在谈推荐理由:Step 3.7 Flash 以 400 tokens/s 的速度刷新了推理效率,做实时 AI 应用或智能体开发的团队可以直接在 Fireworks AI 上试用,省去自建推理基础设施的麻烦。原文
02:25阶跃星辰 Stepfun@Stepfun_AI精选在 ClawCon Macao 上,阶跃星辰开发者业务总经理 EileenTal 阐述了智能体发展的下一阶段,并发布了 Step 3.7 Flash 模型。该模型强调在保持智能水平的同时大幅提升效率,旨在让 AI 真正落地到实际工作中。Step 3.7 Flash 针对开发者场景优化,降低了推理成本与延迟,使得复杂任务可以更快完成。这一发布标志着阶跃星辰从追求模型智能转向关注实际应用效率的战略转变。AI模型阶跃星辰Step 3.7 Flash智能体效率优化开发者推荐理由:阶跃星辰把 AI 从「炫技」拉回「干活」——Step 3.7 Flash 在保持智能的同时大幅提升效率,做 AI 应用落地的开发者值得关注,能直接降低推理成本。原文
14:36阶跃星辰 Stepfun@Stepfun_AI88°阶跃星辰发布了 Step 3.7 Flash 模型,专注于智能体效率,在 ClawEval-1.1、SimpleVQA Search 等基准测试中取得领先成绩。该模型采用 198B 稀疏 MoE 架构,约 11B 活跃参数,支持 400 TPS 推理速度和 256K 上下文,并提供三种推理级别。它擅长理解 UI、图表、文档和图像,并能直接编写代码或调用工具执行操作,在 τ²-bench 上工具调用可靠性超过 98%。模型权重以 Apache 2.0 开源,可在 Mac Studio M4 Max、DGX Spark 等设备本地运行,并兼容 Claude Code、MCP 等生态。AI模型阶跃星辰Step 3.7 Flash智能体开源/仓库推理模型2 个信源在谈推荐理由:做智能体、编程或搜索应用的开发者终于有了一个兼顾速度、成本和可靠性的开源模型——Step 3.7 Flash 在工具调用和视觉理解上表现突出,而且能在本地跑,建议直接试试。原文
12:15OpenRouter@OpenRouterAI精选阶跃星辰的 Step 3.7 Flash 模型已在 OpenRouter 平台上线。该模型是一个多模态(图像/视频/文本)MoE 架构,总参数量达 196B,但推理时仅激活 11B 参数,效率极高。模型针对编程、智能体工作流和结构化输出进行了专门调优,并支持可选的推理级别,用户可根据需求在速度、成本和深度之间灵活权衡。AI模型阶跃星辰Step 3.7 FlashMoE多模态编程助手2 个信源在谈推荐理由:做编程和智能体开发的团队终于有了一个高效的多模态 MoE 选择——196B 参数只激活 11B,成本可控且支持灵活推理级别,建议在 OpenRouter 上直接试。原文
09:07IT之家(博客/媒体)精选76°阶跃星辰今日发布并开源 Step 3.7 Flash,这是一款面向 Agent 生产化阶段的新一代 Flash 模型。该模型采用稀疏 MoE 架构,总参数 196B,激活参数 11B,最高生成速度达 400 Tokens/s,适合高频、多轮、低等待的 Agent 应用。Step 3.7 Flash 具备原生多模态理解与执行、联网与视觉搜索增强、高可靠工具调用与编排等能力,并针对主流 Agent 框架和 MCP 协议进行了兼容优化。开源链接包括 Model Page、GitHub、Huggingface 和 Modelscope,国内海外平台均提供 API 接入。AI模型阶跃星辰Step 3.7 Flash开源/仓库Agent/智能体多模态2 个信源在谈推荐理由:做 Agent 开发的团队终于有了一个原生优化、速度极快的开源模型——Step 3.7 Flash 直接兼容 Claude Code、MCP 等主流框架,接入成本低,值得立刻试跑。原文