全部 AI 动态 · AI 热点

6月27日

12:25

Fireworks AI@FireworksAI_HQ

FactoryAI 将模型管理平台标准化为 Fireworks，实现部署扩展。此举带来开放模型增长 2-3 倍，每美元工作量提升 5-15 倍，并能第一时间获取新开放权重模型。团队负责人 Leo Tchourakov 在视频中详解了具体实现。

技巧 Fireworks FactoryAI 开放模型模型管理部署优化

推荐理由：想提升AI模型部署效率？看看FactoryAI怎么用Fireworks实现5-15倍成本效益，还能第一时间用上新模型。

原文

6月26日

08:55

Fireworks AI@FireworksAI_HQ

精选

Fireworks 宣布对 NVIDIA Nemotron 3 的强化学习微调功能上线，首批支持 Nemotron 3 Super 的 LoRA 微调。训练采用 GRPO 算法，可在一处平台完成训练和部署。计费方式改为按 GPU 小时而非按 token，解决了长多轮对话成本不可控的问题。

AI产品 Nemotron 3 Fireworks 微调 RL训练 GRPO

推荐理由：Fireworks 刚上线了 Nemotron 3 的 RL 微调，按 GPU 小时计费不怕长对话烧钱，用 GRPO 训练一条龙搞定。

原文

6月25日

05:58

Fireworks AI@FireworksAI_HQ

Fireworks AI 宣布其平台现支持对开源编码模型 GLM 5.2 进行微调，涵盖 SFT、DPO 和 RL 三种方法。GLM 5.2 在多个编码基准上表现强势，但 Fireworks 指出排行榜赢家未必适合你的代码库，微调可缩小差距。训练后的模型可直接在同一生产栈上提供服务，无需切换或迁移。早期客户反馈热烈，目前开放私测申请。

AI产品 GLM 5.2 Fireworks SFT DPO 微调

推荐理由：想用最强开源编码模型但通用版不顺手？Fireworks 让你微调 GLM 5.2，SFT/DPO/RL 全包，训练完直接上线，不用折腾。

原文

6月17日

09:34

Fireworks AI@FireworksAI_HQ

Kimi 2.7 现已完全在 Fireworks 上可训练，支持 SFT、DPO、RL 等训练方式。用户可以使用自己的数据微调模型，构建比前沿模型成本更低的护城河。Fireworks 提供托管点击或原始 API，支持大上下文和巨大 LoRA 秩。

AI产品 Kimi 2.7 Fireworks 微调模型训练

推荐理由：Fireworks 让你拿 Kimi 2.7 自己训练，便宜还能干翻前沿模型，想定制模型的赶紧试试。

原文

09:34

Fireworks AI@FireworksAI_HQ

精选71°

GLM 5.2 已在 Fireworks 平台零日上线。该模型拥有 1M token 上下文窗口，定位为编码优先的前沿模型。其性能在 SWE-bench、Terminal-Bench、GPQA 和 AIME 等基准上得到独立验证。Fireworks 在智谱开源模型权重后立即在其基础设施上提供服务。

AI模型 GLM 5.2 Fireworks 智谱推理模型编程助手

推荐理由：Fireworks 第一时间上线了 GLM 5.2，百万 token 上下文很能打，编程基准表现不错，做开发的可以试试。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

02:05

elvis@omarsar0

Elvis Saravia在推文中强调，AI工程师应掌握自己的智能决策。该推文获得2148次浏览和11次点赞。Fireworks使个人开发者更容易拥有和控制自己的AI系统。

技巧 Fireworks Lin Qiao Elvis Saravia AI所有权

推荐理由：Elvis Saravia用数据说话，告诉你别把AI决策权外包。Fireworks让你也能轻松掌控模型。

原文

6月15日

11:11

elvis@omarsar0

Omar Sanseviero分享了一个名为llm-council的开源技能，用于在Claude Code中组合多个LLM组成委员会进行深度研究。该技能默认使用Fireworks AI的API，但可轻松适配OpenRouter。项目托管在github.com/dair-ai/dair-ai仓库，目前支持Claude Code，但可能兼容其他智能体。作者表示可用此技能执行复杂的研究任务，并计划未来扩展到更多领域和动态工作流。

技巧 llm-council Fireworks Claude Code 智能体研究任务

推荐理由：分享了一个LLM委员会技能，能组合多个模型做研究

原文

6月13日

16:53

Fireworks AI@FireworksAI_HQ

精选

Moonshot 推出 K2.7 Code，这是其 K2 系列的最新编程模型，已在 Fireworks 的 serverless 和 API 上上线。相比 K2.6，K2.7 Code 的推理 token 减少约 30%，同时在 Moonshot 的编程基准测试中得分更高。对于智能体编程任务，这一效率提升显著。

AI模型 K2.7 Code Moonshot Fireworks 编程助手推理模型

推荐理由：编程模型 token 省 30% 还更强

原文

16:53

Fireworks AI@FireworksAI_HQ

精选

Fireworks AI 为 Qwen 模型新增长时智能体循环功能，支持观察、推理、编码、执行和验证的重复流程。Qwen 官方演示运行了 11 小时，生成了超过 10,000 行代码并执行了 1,000 多次调用。Fireworks 提供 reasoning_history 参数以跨轮次保留推理上下文，支持按请求切换思考/非思考模式，以及原生图像和文本输入。默认启用 262k 上下文和提示缓存，缓存输入价格为每百万 token 0.10 美元。

AI产品 Fireworks Qwen 智能体 MCP/工具推理模型

推荐理由：Fireworks 让 Qwen 跑 11 小时智能体循环

原文

16:53

Fireworks AI@FireworksAI_HQ

Fireworks 宣布作为真正的推理提供商部署 Qwen 3.7 Plus，请求在其硬件上端到端执行，使用授权权重，无转发。Qwen 3.7 Plus（思考模式）在 AIME 2025 上匹配 Max 性能，端到端吞吐量比 Qwen 3.6 Plus 高 3.55 倍。

AI模型 Qwen 3.7 Plus Fireworks AIME 2025 推理模型

推荐理由：Fireworks 直营 Qwen 3.7 Plus，吞吐量翻倍

原文

12:38

Fireworks AI@FireworksAI_HQ

精选

Fireworks 宣布 Kimi K2 模型现已在 serverless 平台上可用。标准层按 token 计费，输入 $0.95/1M token，输出 $4/1M token，缓存命中 $0.19/1M token。上下文窗口达 256K。优先层面向关键工作负载，快速路径即将推出。

AI产品 Fireworks Kimi K2 serverless 推理模型定价

推荐理由：Fireworks上线Kimi K2，价格超低

原文

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月7日

04:18

Fireworks AI@FireworksAI_HQ

精选

Fireworks 训练平台持续扩展，现已支持美国领先的开源权重模型 Nemotron 3 Ultra 进行后训练。用户可以通过 LoRA 或全参数微调进行 SFT 和 DPO，且训练与推理使用同一基础设施。这意味着训练出的模型可以直接部署，无需额外迁移。该平台旨在简化从训练到上线的流程，适合需要定制化模型的团队。

AI产品 Fireworks Nemotron 3 Ultra 模型微调 LoRA 训练平台

推荐理由：Fireworks 把 Nemotron 3 Ultra 的后训练和推理放在同一基础设施上，做模型微调的团队可以直接训练并上线，省去模型迁移的麻烦，值得关注。

原文

6月5日

06:46

Fireworks AI@FireworksAI_HQ

Fireworks AI 被 Redpoint 的 InfraRed 100 榜单收录，该榜单表彰为下一波 AI 浪潮构建基础的公司。Fireworks 表示这只是开始，并邀请更多人加入。Redpoint 的 InfraRed 100 涵盖了从世界模型、智能体运行时到沙盒、数据库和安全工具等关键基础设施。这标志着 Fireworks 在 AI 基础设施领域获得了重要认可。

行业 Fireworks AI基础设施 Redpoint InfraRed 100 行业认可

推荐理由：Fireworks 入选 Redpoint 的 InfraRed 100，说明其 AI 基础设施能力被顶级风投认可，做模型部署和推理优化的团队值得关注这家公司的发展动态。

原文

6月3日

08:37

Fireworks AI@FireworksAI_HQ

微软 MAI 模型即将在 Fireworks 平台上架，提供可控的智能和可追溯的端到端数据链。企业用户可针对自身任务对 MAI 推理模型进行微调，使用自己的数据构建定制化模型。这标志着微软将企业级 AI 能力进一步开放给开发者，Fireworks 作为高性能推理平台，将加速 MAI 模型的落地应用。

AI产品微软 MAI Fireworks 企业微调推理模型

推荐理由：企业 AI 团队终于有了可定制的推理模型——MAI 支持端到端数据溯源和私有微调，做企业级 AI 应用的开发者可以直接在 Fireworks 上尝试，省去自建基础设施的麻烦。

原文

5月30日

11:09

Fireworks AI@FireworksAI_HQ

在GTC 2026大会上，英伟达CEO黄仁勋将AI初创公司Fireworks比喻为“AI工厂的台积电”，强调其在AI基础设施中的关键制造角色。Fireworks是一家专注于AI推理和模型部署的云服务商，提供高效的GPU集群和优化服务。黄仁勋的言论凸显了AI产业链中专业基础设施服务的重要性，类似台积电在半导体制造中的核心地位。这一评价也反映了英伟达对生态合作伙伴的重视，以及AI行业从模型训练向推理部署转移的趋势。

行业英伟达 Fireworks AI基础设施 GTC 2026 推理部署

推荐理由：黄仁勋的比喻点明了AI基础设施服务正在成为新产业链的关键环节，做AI部署和推理优化的团队值得关注Fireworks的模式。

原文

11:08

Fireworks AI@FireworksAI_HQ

精选

Fireworks AI 发布了 Serverless 2.0，提供三种服务路径：Standard（弹性默认）、Priority（拥堵时最后降级，价格约 1.5 倍）和 Fast（Kimi K2.6 和 GLM 5.1 上超 100 tok/s）。该方案解决了传统 AI 推理中需要预留 GPU 才能保证可靠性的痛点，让开发者按需使用、灵活选择性能与成本。用户无需提前锁定资源即可获得高吞吐和低延迟，降低了 AI 部署的门槛。

AI产品 Fireworks Serverless 2.0 AI推理 GPU Kimi K2.6

推荐理由：做 AI 推理部署的团队终于不用为可靠性提前锁死 GPU 了——Fireworks 的三种路径按需选，Kimi K2.6 和 GLM 5.1 还能跑 100+ tok/s，值得试试。

原文

5月21日

16:11

Fireworks AI@FireworksAI_HQ

76°

Cursor 团队没有通过提示工程优化 Composer 2.5，而是直接训练了模型。他们与 Fireworks 合作，在 Fireworks 上运行大规模强化学习（RL）滚动，同时进行生产推理。Fireworks 强调，到 2027 年，训练自己的模型是维持竞争护城河的唯一方式。这一做法展示了从提示工程到模型训练的转变趋势。

AI产品 Cursor Composer 2.5 强化学习模型训练 Fireworks

推荐理由：Cursor 用 RL 训练模型而非提示工程，给 AI 产品团队一个关键信号：2027 年后，训练自己的模型才是护城河。做 AI 应用开发的建议点开，看看他们怎么和 Fireworks 合作跑 RL 滚动。

原文

07:46

Fireworks AI@FireworksAI_HQ

精选

Fireworks AI 与 NotteCore 合作，在多个前沿模型上运行了 720 个浏览器代理任务。结果显示，某个基线模型在约 1/5 的调用中产生格式错误输出，导致多步工作流中频繁重试。而 Kimi K2.5、GLM-5 和 MiniMax M2.5 在 Fireworks 上运行时，重试率近乎为零，且随着任务步骤增加，延迟保持稳定。这一差异在生产级代理系统中直接体现为成本、延迟和可靠性的分化。完整报告已发布。

AI产品浏览器代理模型对比重试率 Kimi K2.5 GLM-5 MiniMax M2.5 Fireworks

推荐理由：做浏览器自动化或代理系统的团队，这个对比直接告诉你模型选择如何影响生产环境的成本和稳定性——Kimi/GLM/MiniMax 的低重试率值得关注。

原文

5月16日

23:03

Fireworks AI@FireworksAI_HQ

精选

Fireworks 宣布其训练平台进一步扩展，即日起通过 Training API 支持 GLM 5.1 的 LoRA RL（强化学习），包括 SFT、DPO 和完整 RL 训练，上下文窗口达 200K。用户可使用自定义损失函数或智能默认设置，无使用上限，无需积分兑换，训练后的模型归用户所有并可用于推理。同时，从 6 月 15 日起，付费 Claude 计划用户可获得每月专用积分，用于 Claude Agent SDK、claude -p、Claude Code GitHub Actions 及基于 Agent SDK 的第三方应用。

AI产品 Fireworks GLM 5.1 LoRA RL 训练平台 Claude

推荐理由：Fireworks 让 GLM 5.1 的强化学习训练变得简单且无上限，做模型微调或 RL 研究的团队可以直接上手，不用操心配额和积分。

原文