Fireworks

§ 01综述

Fireworks 是一家专注于高性能 AI 模型部署与微调的云服务平台，旨在降低企业使用开源和闭源大语言模型的门槛。它提供从模型托管、微调（SFT、DPO、RL）到推理优化的全栈解决方案，近期在模型组合、数值一致性及工具集成上取得突破。

Fireworks 近期进展

模型微调服务扩展：Fireworks 推出 Nemotron 3 的 RL 微调服务，按 GPU 小时计费，并支持 GLM 5.2 的 SFT/DPO/RL 微调，帮助用户针对编码、推理等任务定制模型。原文链接

模型组合成本优化：Fireworks 研究显示，混合使用开源与闭源模型可降低 40-67% 的推理成本，同时保持或提升任务效果，为企业提供了更经济的部署方案。原文链接

工具集成与生态合作：Fireworks 推出 FireConnect 功能，使开源模型能无缝集成到 Claude Code 等编码工具中；同时与 LangChain 合作微调 Qwen 法官模型，用于检测感知错误。原文链接

数值一致性与可靠性提升：Fireworks 解决了 RL 训练与推理间的数值不一致问题，确保模型行为可复现，并推出 GLM 5.2 托管服务，该模型在 211 项真实工程任务中表现优于 Opus 4.8 和 GPT-5.5。原文链接

当前焦点与观察点

当前 Fireworks 的焦点集中于两方面：一是通过模型组合策略（如开源+闭源）降低企业 AI 落地成本，这直接回应了行业对性价比的迫切需求；二是提升微调与推理的工程可靠性，例如数值一致性、工具兼容性等，以解决模型从训练到部署的“最后一公里”问题。值得注意的是，其与 Cursor、Claude Code 等编码工具的深度集成，表明 Fireworks 正瞄准开发者社区，试图成为 AI 应用构建的基础设施层。未来，随着更多厂商推出托管微调服务，Fireworks 的差异化优势将取决于其多模型编排能力与实际成本节省效果。

§ 02相关报道10 条在档

§ 03邻近话题