04:18Fireworks AI@FireworksAI_HQ精选Fireworks 训练平台持续扩展,现已支持美国领先的开源权重模型 Nemotron 3 Ultra 进行后训练。用户可以通过 LoRA 或全参数微调进行 SFT 和 DPO,且训练与推理使用同一基础设施。这意味着训练出的模型可以直接部署,无需额外迁移。该平台旨在简化从训练到上线的流程,适合需要定制化模型的团队。AI产品FireworksNemotron 3 Ultra模型微调LoRA训练平台9 个信源在谈推荐理由:Fireworks 把 Nemotron 3 Ultra 的后训练和推理放在同一基础设施上,做模型微调的团队可以直接训练并上线,省去模型迁移的麻烦,值得关注。原文
23:03Fireworks AI@FireworksAI_HQ精选Fireworks 宣布其训练平台进一步扩展,即日起通过 Training API 支持 GLM 5.1 的 LoRA RL(强化学习),包括 SFT、DPO 和完整 RL 训练,上下文窗口达 200K。用户可使用自定义损失函数或智能默认设置,无使用上限,无需积分兑换,训练后的模型归用户所有并可用于推理。同时,从 6 月 15 日起,付费 Claude 计划用户可获得每月专用积分,用于 Claude Agent SDK、claude -p、Claude Code GitHub Actions 及基于 Agent SDK 的第三方应用。AI产品FireworksGLM 5.1LoRA RL训练平台Claude推荐理由:Fireworks 让 GLM 5.1 的强化学习训练变得简单且无上限,做模型微调或 RL 研究的团队可以直接上手,不用操心配额和积分。原文