fireworks·general

Fireworks

别名
首次出现
2026-05-22
最近出现
2026-06-07
累计提及
58
§ 01综述

Fireworks AI 近期动作频频,定位从模型推理平台向 AI 基础设施服务商跃升。其核心主张是:为企业提供比自建 GPU 集群更高效、更低成本的推理与训练服务。

近期主要进展:

  • 推出 Serverless 2.0,三种服务路径降低使用门槛:新版无服务器推理方案允许用户无需预留 GPU 即可调用模型,按实际使用量计费,同时提供标准 API、批处理与专属端点三种选择,旨在吸引不同规模的企业客户(Fireworks 推出 Serverless 2.0:无需预留 GPU,三种服务路径)。
  • 业务数据爆发式增长:Fireworks 透露其推理业务年化收入已达 8 亿美元,2025 年第一季度增长 4 倍;每日处理 30 万亿 token,且开源模型在其平台上的推理份额持续攀升(Fireworks AI 推理业务年化收入达 8 亿美元,Q1 增长 4 倍Fireworks AI:每日处理30万亿token,开源模型份额持续攀升)。
  • 黄仁勋盛赞:称其为“AI 工厂的台积电”,暗示 Fireworks 在模型部署领域扮演类似 Foundry 的角色——专注于生产环节的规模化与优化,而非设计。这一比喻迅速提升了其在行业内的关注度(黄仁勋称Fireworks为“AI工厂的台积电”)。
  • 生态案例凸显低成本与高性能:安全公司 Ramp Labs 通过 Fireworks 平台用开源模型替代闭源 API,在验证 1 万条智能合约时成本降低 5 倍,仍能发现高危漏洞。此外,Fireworks 测试 720 个浏览器代理任务时,多个中国开源模型(Kimi K2.5、GLM-5、MiniMax M2.5)的零重试率表现突出(Ramp Labs 用 1 万智能体验证:开源模型成本低 5 倍,仍能发现高危漏洞Fireworks 测试 720 个浏览器代理任务)。
  • 当前焦点 / 未来观察点:

    Fireworks 的快速发展依赖两个关键趋势:一是开源模型性能持续逼近闭源模型,企业对推理成本敏感度上升;二是其对“Serverless”与“按需 GPU”的重新定义,正在挑战传统云 GPU 租赁模式。后续需关注其能否在保持低成本的同时维持低延迟,以及当更多云巨头推出类似服务时,Fireworks 的技术壁垒有多深。此外,其近期支持 Cursor 团队训练 Composer 2.5 的强化学习项目,也暗示正从纯推理向训练侧渗透,这是否会开辟新营收曲线值得观察。

    § 02相关报道10 条在档
    1. 01
      Fireworks 训练平台扩展,支持 Nemotron 3 Ultra 后训练
      Fireworks AI
    2. 02
      Fireworks 入选 Redpoint InfraRed 100,AI 基础设施新星
      Fireworks AI
    3. 03
      NVIDIA Nemotron 3 Ultra 登陆 Fireworks,开源前沿推理与编排模型
      Fireworks AI
    4. 04
      Step 3.7 Flash 上线 Fireworks AI,速度达 400 tokens/s
      阶跃星辰 Stepfun
    5. 05
      微软 Foundry 上线七款零蒸馏模型,多模态已登陆 OpenRouter
      AI Will
    6. 06
      Step 3.7 Flash:198B稀疏MoE视觉语言模型,推理效率优先
      Fireworks AI
    7. 07
      路由+微调开源模型:更准、更快、更便宜,Harvey 法律案例验证
      Clement Delangue
    8. 08
      微调到生产推理的鸿沟:团队卡在哪?MSBuild 讨论
      Fireworks AI
    9. 09
      GLM 5.1 + Claude Opus 4.7 顾问模式:法律基准 18/100,成本降 61%
      Fireworks AI
    10. 10
      MSBuild Day 2:Fireworks AI 展示定制化推理与规模化部署
      Fireworks AI
    § 03邻近话题

    本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

    /topic/Fireworks