Fireworks AI 是目前增长最快的大模型推理服务平台之一,专注为开源模型提供高性能、生产级的推理和微调服务。截至 2025 年 Q1,其推理业务年化收入已达 8 亿美元,单季度增长 4 倍,每日处理超过 30 万亿 token,开源模型市场份额持续攀升。
- 近期主要进展包括:
- Fireworks AI:每日处理30万亿token,开源模型份额持续攀升
- Fireworks AI 推理业务年化收入达 8 亿美元,Q1 增长 4 倍
- Fireworks AI 推出 Gemma 4 Dense 微调:周末 Vibe Coding 也能持续进化
- Fireworks AI 在 Azure AI Foundry 提供生产级推理层
- Fireworks AI 推出 Qwen 3.6 27B 微调服务
当前焦点在于:Fireworks AI 正通过高频推出模型微调服务(如 Gemma 4、Qwen 3.6)、扩展与云平台的合作(如 Azure AI Foundry)、以及举办技术活动(如 Nerd Meet Up)来巩固其推理基础设施的地位。值得观察的是,随着 LangChain 等生态伙伴开始自建智能体学习实验室,Fireworks 能否持续作为独立推理层保持技术领先和客户粘性。