12:25Fireworks AI@FireworksAI_HQFactoryAI 将模型管理平台标准化为 Fireworks,实现部署扩展。此举带来开放模型增长 2-3 倍,每美元工作量提升 5-15 倍,并能第一时间获取新开放权重模型。团队负责人 Leo Tchourakov 在视频中详解了具体实现。技巧FireworksFactoryAI开放模型模型管理部署优化推荐理由:想提升AI模型部署效率?看看FactoryAI怎么用Fireworks实现5-15倍成本效益,还能第一时间用上新模型。原文
08:55Fireworks AI@FireworksAI_HQ精选Fireworks 宣布对 NVIDIA Nemotron 3 的强化学习微调功能上线,首批支持 Nemotron 3 Super 的 LoRA 微调。训练采用 GRPO 算法,可在一处平台完成训练和部署。计费方式改为按 GPU 小时而非按 token,解决了长多轮对话成本不可控的问题。AI产品Nemotron 3Fireworks微调RL训练GRPO6 个信源在谈推荐理由:Fireworks 刚上线了 Nemotron 3 的 RL 微调,按 GPU 小时计费不怕长对话烧钱,用 GRPO 训练一条龙搞定。原文
05:58Fireworks AI@FireworksAI_HQFireworks AI 宣布其平台现支持对开源编码模型 GLM 5.2 进行微调,涵盖 SFT、DPO 和 RL 三种方法。GLM 5.2 在多个编码基准上表现强势,但 Fireworks 指出排行榜赢家未必适合你的代码库,微调可缩小差距。训练后的模型可直接在同一生产栈上提供服务,无需切换或迁移。早期客户反馈热烈,目前开放私测申请。AI产品GLM 5.2FireworksSFTDPO微调推荐理由:想用最强开源编码模型但通用版不顺手?Fireworks 让你微调 GLM 5.2,SFT/DPO/RL 全包,训练完直接上线,不用折腾。原文
09:34Fireworks AI@FireworksAI_HQKimi 2.7 现已完全在 Fireworks 上可训练,支持 SFT、DPO、RL 等训练方式。用户可以使用自己的数据微调模型,构建比前沿模型成本更低的护城河。Fireworks 提供托管点击或原始 API,支持大上下文和巨大 LoRA 秩。AI产品Kimi 2.7Fireworks微调模型训练推荐理由:Fireworks 让你拿 Kimi 2.7 自己训练,便宜还能干翻前沿模型,想定制模型的赶紧试试。原文
09:34Fireworks AI@FireworksAI_HQ精选71°GLM 5.2 已在 Fireworks 平台零日上线。该模型拥有 1M token 上下文窗口,定位为编码优先的前沿模型。其性能在 SWE-bench、Terminal-Bench、GPQA 和 AIME 等基准上得到独立验证。Fireworks 在智谱开源模型权重后立即在其基础设施上提供服务。AI模型GLM 5.2Fireworks智谱推理模型编程助手1 个信源在谈推荐理由:Fireworks 第一时间上线了 GLM 5.2,百万 token 上下文很能打,编程基准表现不错,做开发的可以试试。原文
02:05elvis@omarsar0Elvis Saravia在推文中强调,AI工程师应掌握自己的智能决策。该推文获得2148次浏览和11次点赞。Fireworks使个人开发者更容易拥有和控制自己的AI系统。技巧FireworksLin QiaoElvis SaraviaAI所有权推荐理由:Elvis Saravia用数据说话,告诉你别把AI决策权外包。Fireworks让你也能轻松掌控模型。原文
11:11elvis@omarsar0Omar Sanseviero分享了一个名为llm-council的开源技能,用于在Claude Code中组合多个LLM组成委员会进行深度研究。该技能默认使用Fireworks AI的API,但可轻松适配OpenRouter。项目托管在github.com/dair-ai/dair-ai仓库,目前支持Claude Code,但可能兼容其他智能体。作者表示可用此技能执行复杂的研究任务,并计划未来扩展到更多领域和动态工作流。技巧llm-councilFireworksClaude Code智能体研究任务推荐理由:分享了一个LLM委员会技能,能组合多个模型做研究原文
16:53Fireworks AI@FireworksAI_HQ精选Moonshot 推出 K2.7 Code,这是其 K2 系列的最新编程模型,已在 Fireworks 的 serverless 和 API 上上线。相比 K2.6,K2.7 Code 的推理 token 减少约 30%,同时在 Moonshot 的编程基准测试中得分更高。对于智能体编程任务,这一效率提升显著。AI模型K2.7 CodeMoonshotFireworks编程助手推理模型推荐理由:编程模型 token 省 30% 还更强原文
16:53Fireworks AI@FireworksAI_HQ精选Fireworks AI 为 Qwen 模型新增长时智能体循环功能,支持观察、推理、编码、执行和验证的重复流程。Qwen 官方演示运行了 11 小时,生成了超过 10,000 行代码并执行了 1,000 多次调用。Fireworks 提供 reasoning_history 参数以跨轮次保留推理上下文,支持按请求切换思考/非思考模式,以及原生图像和文本输入。默认启用 262k 上下文和提示缓存,缓存输入价格为每百万 token 0.10 美元。AI产品FireworksQwen智能体MCP/工具推理模型推荐理由:Fireworks 让 Qwen 跑 11 小时智能体循环原文
16:53Fireworks AI@FireworksAI_HQFireworks 宣布作为真正的推理提供商部署 Qwen 3.7 Plus,请求在其硬件上端到端执行,使用授权权重,无转发。Qwen 3.7 Plus(思考模式)在 AIME 2025 上匹配 Max 性能,端到端吞吐量比 Qwen 3.6 Plus 高 3.55 倍。AI模型Qwen 3.7 PlusFireworksAIME 2025推理模型推荐理由:Fireworks 直营 Qwen 3.7 Plus,吞吐量翻倍原文
12:38Fireworks AI@FireworksAI_HQ精选Fireworks 宣布 Kimi K2 模型现已在 serverless 平台上可用。标准层按 token 计费,输入 $0.95/1M token,输出 $4/1M token,缓存命中 $0.19/1M token。上下文窗口达 256K。优先层面向关键工作负载,快速路径即将推出。AI产品FireworksKimi K2serverless推理模型定价推荐理由:Fireworks上线Kimi K2,价格超低原文
04:18Fireworks AI@FireworksAI_HQ精选Fireworks 训练平台持续扩展,现已支持美国领先的开源权重模型 Nemotron 3 Ultra 进行后训练。用户可以通过 LoRA 或全参数微调进行 SFT 和 DPO,且训练与推理使用同一基础设施。这意味着训练出的模型可以直接部署,无需额外迁移。该平台旨在简化从训练到上线的流程,适合需要定制化模型的团队。AI产品FireworksNemotron 3 Ultra模型微调LoRA训练平台9 个信源在谈推荐理由:Fireworks 把 Nemotron 3 Ultra 的后训练和推理放在同一基础设施上,做模型微调的团队可以直接训练并上线,省去模型迁移的麻烦,值得关注。原文
06:46Fireworks AI@FireworksAI_HQFireworks AI 被 Redpoint 的 InfraRed 100 榜单收录,该榜单表彰为下一波 AI 浪潮构建基础的公司。Fireworks 表示这只是开始,并邀请更多人加入。Redpoint 的 InfraRed 100 涵盖了从世界模型、智能体运行时到沙盒、数据库和安全工具等关键基础设施。这标志着 Fireworks 在 AI 基础设施领域获得了重要认可。行业FireworksAI基础设施RedpointInfraRed 100行业认可推荐理由:Fireworks 入选 Redpoint 的 InfraRed 100,说明其 AI 基础设施能力被顶级风投认可,做模型部署和推理优化的团队值得关注这家公司的发展动态。原文
08:37Fireworks AI@FireworksAI_HQ微软 MAI 模型即将在 Fireworks 平台上架,提供可控的智能和可追溯的端到端数据链。企业用户可针对自身任务对 MAI 推理模型进行微调,使用自己的数据构建定制化模型。这标志着微软将企业级 AI 能力进一步开放给开发者,Fireworks 作为高性能推理平台,将加速 MAI 模型的落地应用。AI产品微软MAIFireworks企业微调推理模型推荐理由:企业 AI 团队终于有了可定制的推理模型——MAI 支持端到端数据溯源和私有微调,做企业级 AI 应用的开发者可以直接在 Fireworks 上尝试,省去自建基础设施的麻烦。原文
11:09Fireworks AI@FireworksAI_HQ在GTC 2026大会上,英伟达CEO黄仁勋将AI初创公司Fireworks比喻为“AI工厂的台积电”,强调其在AI基础设施中的关键制造角色。Fireworks是一家专注于AI推理和模型部署的云服务商,提供高效的GPU集群和优化服务。黄仁勋的言论凸显了AI产业链中专业基础设施服务的重要性,类似台积电在半导体制造中的核心地位。这一评价也反映了英伟达对生态合作伙伴的重视,以及AI行业从模型训练向推理部署转移的趋势。行业英伟达FireworksAI基础设施GTC 2026推理部署推荐理由:黄仁勋的比喻点明了AI基础设施服务正在成为新产业链的关键环节,做AI部署和推理优化的团队值得关注Fireworks的模式。原文
11:08Fireworks AI@FireworksAI_HQ精选Fireworks AI 发布了 Serverless 2.0,提供三种服务路径:Standard(弹性默认)、Priority(拥堵时最后降级,价格约 1.5 倍)和 Fast(Kimi K2.6 和 GLM 5.1 上超 100 tok/s)。该方案解决了传统 AI 推理中需要预留 GPU 才能保证可靠性的痛点,让开发者按需使用、灵活选择性能与成本。用户无需提前锁定资源即可获得高吞吐和低延迟,降低了 AI 部署的门槛。AI产品FireworksServerless 2.0AI推理GPUKimi K2.6推荐理由:做 AI 推理部署的团队终于不用为可靠性提前锁死 GPU 了——Fireworks 的三种路径按需选,Kimi K2.6 和 GLM 5.1 还能跑 100+ tok/s,值得试试。原文
16:11Fireworks AI@FireworksAI_HQ76°Cursor 团队没有通过提示工程优化 Composer 2.5,而是直接训练了模型。他们与 Fireworks 合作,在 Fireworks 上运行大规模强化学习(RL)滚动,同时进行生产推理。Fireworks 强调,到 2027 年,训练自己的模型是维持竞争护城河的唯一方式。这一做法展示了从提示工程到模型训练的转变趋势。AI产品CursorComposer 2.5强化学习模型训练Fireworks10 个信源在谈推荐理由:Cursor 用 RL 训练模型而非提示工程,给 AI 产品团队一个关键信号:2027 年后,训练自己的模型才是护城河。做 AI 应用开发的建议点开,看看他们怎么和 Fireworks 合作跑 RL 滚动。原文
07:46Fireworks AI@FireworksAI_HQ精选Fireworks AI 与 NotteCore 合作,在多个前沿模型上运行了 720 个浏览器代理任务。结果显示,某个基线模型在约 1/5 的调用中产生格式错误输出,导致多步工作流中频繁重试。而 Kimi K2.5、GLM-5 和 MiniMax M2.5 在 Fireworks 上运行时,重试率近乎为零,且随着任务步骤增加,延迟保持稳定。这一差异在生产级代理系统中直接体现为成本、延迟和可靠性的分化。完整报告已发布。AI产品浏览器代理模型对比重试率Kimi K2.5GLM-5MiniMax M2.5Fireworks3 个信源在谈推荐理由:做浏览器自动化或代理系统的团队,这个对比直接告诉你模型选择如何影响生产环境的成本和稳定性——Kimi/GLM/MiniMax 的低重试率值得关注。原文
23:03Fireworks AI@FireworksAI_HQ精选Fireworks 宣布其训练平台进一步扩展,即日起通过 Training API 支持 GLM 5.1 的 LoRA RL(强化学习),包括 SFT、DPO 和完整 RL 训练,上下文窗口达 200K。用户可使用自定义损失函数或智能默认设置,无使用上限,无需积分兑换,训练后的模型归用户所有并可用于推理。同时,从 6 月 15 日起,付费 Claude 计划用户可获得每月专用积分,用于 Claude Agent SDK、claude -p、Claude Code GitHub Actions 及基于 Agent SDK 的第三方应用。AI产品FireworksGLM 5.1LoRA RL训练平台Claude推荐理由:Fireworks 让 GLM 5.1 的强化学习训练变得简单且无上限,做模型微调或 RL 研究的团队可以直接上手,不用操心配额和积分。原文