近期,Moonshot AI 旗下 Kimi 系列模型迎来重大升级,核心型号 K2.5 在编程与长上下文推理领域展现强劲实力。该模型不仅在技术社区引起关注,更被集成到产品中形成实际应用。
- 主要进展
- 极低硬件门槛运行大模型:有开发者尝试在 RTX 3060 显卡上运行完整的 Kimi K2.5(号称万亿参数),实际输出速度约 4 tokens/sec,展示了模型对低算力硬件的适应性。(用RTX 3060运行1万亿参数模型Kimi K2.5)
- 浏览器代理任务表现优异:Fireworks AI 在 720 个浏览器代理任务测试中发现,Kimi K2.5 与 GLM-5、MiniMax M2.5 的“重试率近乎为零”,意味着任务首次执行成功率极高,操作稳定可靠。(Fireworks 测试720个浏览器代理任务)
- 集成编程工具 Cursor Composer 2.5 发布:基于 Kimi K2.5 打造的 Cursor Composer 2.5 正式推出,马斯克亲自转发并证实其使用 Colossus 2 算力进行训练。该工具在编程代理任务中成本仅为竞品的 1/60,性能却显著提升。(Cursor发布Composer 2.5, Cursor Composer 2.5 发布)
当前焦点 / 未来观察点
当前焦点集中在模型性能与成本平衡上:K2.5 在低端硬件上运行潜力巨大,但实用速度尚需提升;在复杂代理任务中几乎零重试,为自动化应用带来信心。同时,基于该模型的 Cursor Composer 2.5 已获行业领袖背书,其极低成本可能改变编程辅助工具市场竞争格局。未来需关注 Kimi 系列在更多场景下的落地效果,以及生态合作能否持续拓展。