flash·general

Flash

别名
首次出现
2026-05-22
最近出现
2026-06-10
累计提及
397
§ 01综述

近期,“Flash”一词在AI领域频繁出现,主要指向阶跃星辰(Stepfun)发布的Step 3.7 Flash模型,以及Google对Gemini Flash系列的配额调整。这两件事共同反映了行业对高效、低成本推理模型的追求。

  • 阶跃星辰开源Step 3.7 Flash模型:该模型采用MoE架构,总参数量196B(另有报道称198B),但每次推理仅激活约11B参数,支持256K上下文,推理速度最高可达400 tokens/s。(Stepfun 开源 Step 3.7 Flash)
  • 专为智能体与编码优化:Step 3.7 Flash被设计为适合智能体(Agent)场景的高效模型,在编码任务上表现突出,并已获得NVIDIA的NIM、NeMo及GPU加速端点支持。(Step 3.7 Flash 获 NVIDIA 首日支持)
  • 模型生态快速扩展:该模型已在OpenRouter、ZenMuxAI等平台上线,并开源,进一步扩大了其影响力。(Step 3.7 Flash 上线 OpenRouter)
  • Google 修复 Gemini Flash 配额:与此同时,Google修复了Gemini的配额问题,将Ultra用户的Omni生成能力翻倍,显示其Flash系列也在持续迭代。(Google 修复 Gemini 使用配额问题)
  • 当前焦点:Step 3.7 Flash 的高性能(极低的活跃参数与高推理速度)使其成为AI应用落地的有力候选,尤其适合智能体和实时交互场景。未来观察点:该模型能否在开源社区中形成生态,以及Google等巨头是否会推出更具竞争力的Flash类模型。

    § 02相关报道10 条在档
    1. 01
      Gemini 3.5 Flash Live Translate 发布,实时语音翻译支持70+语言
      Logan Kilpatrick
    2. 02
      Step 3.7 Flash 实测:把 Agent Memory 痕迹变成本地检查工具
      shao__meng
    3. 03
      NAS 部署 Hermes Studio + 多模型分工工作流分享
      Geek
    4. 04
      Claude Opus 4.7 登顶 Android Arena 排行榜,Anthropic 占前十五席
      AI Will
    5. 05
      中国AI模型API调用量连续六周超美国,MiniMax M3跻身全球前三
      Pandaily
    6. 06
      中国AI大模型周调用量连续六周超美国,前四名均为国产模型
      IT之家
    7. 07
      Bayesian-Agent:后验引导的 LLM Agent 技能进化框架
      arXiv: DeepSeek
    8. 08
      Step 3.7 Flash 登顶 AA 速度/成本/端到端性能榜
      Pandaily
    9. 09
      DeepSeek 连续四周登顶 OpenRouter Token 份额第一
      SiliconFlowAI
    10. 10
      Eval-Skill:探索引导的评估技能合成,提升奖励模型判断力
      arXiv: DeepSeek
    § 03邻近话题

    本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

    /topic/Flash