14:44rohanpaul_ai@rohanpaul_ai精选有人用单张RTX 3060 12GB GPU和768GB二手Intel Optane持久内存运行了1万亿参数的Kimi K2.5模型,速度超过4 tokens/sec。Kimi K2.5是混合专家模型,总参数1T但每token仅激活32B。RTX 3060的12GB VRAM处理路由、注意力等延迟敏感部分,专家权重存储在Optane PMem中,192GB DDR4 ECC作为缓存。Optane PMem延迟比最佳NVMe SSD低很多,但比DRAM慢2-3倍。llama.cpp通过override-tensor标志调整张量放置,实现混合GPU/CPU推理。AI模型Kimi K2.5混合专家模型推理模型开源/仓库大模型推荐理由:用旧硬件跑万亿模型,省钱又酷原文
07:26eric zakariasson@ericzakariasson83°Cursor 发布了 Composer 2.5,这是其编程代理模型的最新版本。在 Artificial Analysis 编程代理指数中,Composer 2.5 以 62 分排名第三,仅次于 Claude Opus 4.7 和 GPT-5.5,但成本仅为它们的 1/10 到 1/60。标准版每次任务仅需 0.07 美元,Fast 版 0.44 美元,而竞品高达 4 美元以上。在 SWE-Bench-Pro-Hard-AA 上,Composer 2.5 得分 47%,与 Claude Opus 4.7 相当,比上一代提升 35 个百分点。Fast 模式平均 6.7 分钟完成任务,是第三快的编程代理。该模型基于 Kimi K2.5 继续训练,Cursor 贡献了约 85% 的计算量,仅在 Cursor IDE 和 CLI 中可用。AI产品CursorComposer 2.5编程代理成本优化Kimi K2.510 个信源在谈推荐理由:Cursor 用 1/60 的成本实现了接近顶级模型的编程代理性能,做自动化开发或频繁使用 AI 编程的团队可以直接省下大笔费用,建议试试 Fast 模式感受响应速度。原文
07:46Fireworks AI@FireworksAI_HQ精选Fireworks AI 与 NotteCore 合作,在多个前沿模型上运行了 720 个浏览器代理任务。结果显示,某个基线模型在约 1/5 的调用中产生格式错误输出,导致多步工作流中频繁重试。而 Kimi K2.5、GLM-5 和 MiniMax M2.5 在 Fireworks 上运行时,重试率近乎为零,且随着任务步骤增加,延迟保持稳定。这一差异在生产级代理系统中直接体现为成本、延迟和可靠性的分化。完整报告已发布。AI产品浏览器代理模型对比重试率Kimi K2.5GLM-5MiniMax M2.5Fireworks3 个信源在谈推荐理由:做浏览器自动化或代理系统的团队,这个对比直接告诉你模型选择如何影响生产环境的成本和稳定性——Kimi/GLM/MiniMax 的低重试率值得关注。原文
10:41shao__meng@shao__meng83°Cursor 发布了 Composer 2.5 模型,仍然基于 Kimi K2.5,但通过三项关键训练创新实现了显著提升:定向文本反馈强化学习解决了长任务中的信用分配难题;合成训练数据量是 Composer 2 的 25 倍,其中 feature deletion 方法让模型从代码库中重新实现被删除的特性;基础设施层使用 Muon 优化器和分布式正交化,1T 模型单步仅需 0.2 秒。同时,Cursor 与 SpaceXAI 合作,马斯克亲自发帖证实 Composer 2.5 已开始使用 Colossus 2 算力训练,并正在合作从零训练一个算力规模 10 倍以上的全新模型。Composer 2.5 重点改进了长任务持续推进、复杂指令遵循和协作交互自然度,并专门优化了沟通风格和投入度校准两个现有 benchmark 难以衡量的维度。AI产品CursorComposer 2.5Kimi K2.5编程助手强化学习10 个信源在谈推荐理由:Cursor 这次在长任务和指令遵循上的改进,对重度使用 AI 编程助手的开发者来说体感会很直接,尤其是沟通风格和投入度校准这两个软维度优化,建议用 Composer 2.5 的团队直接试试。原文
08:38Fireworks AI@FireworksAI_HQ83°Cursor 团队在 Kimi K2.5 基础模型上相继推出了 Composer 2 和 Composer 2.5 版本。性能基准测试显示显著提升,其中 85% 的性能提升来自强化学习(RL)。Fireworks 为 RL 训练提供了算力支持。Composer 2.5 更智能,能更好处理长时间任务,更可靠地遵循复杂指令。未来一周,该模型的包含使用量将翻倍。AI产品CursorComposer 2.5Kimi K2.5强化学习编程助手10 个信源在谈推荐理由:Cursor 用户和 AI 编程重度使用者可以直接体验更智能的代码补全和长任务处理,性能提升主要靠 RL 而非堆参数,值得关注。原文
00:43Cursor@cursor_ai精选Cursor推出Composer 2.5,与Composer 2共享同一开源基础Moonshot的Kimi K2.5。该版本延续了开源架构,为用户提供更强大的代码生成能力。Cursor团队在X平台上宣布了这一更新,获得843个点赞和66816次查看。AI产品Composer 2.5Kimi K2.5CursorMoonshot编程助手10 个信源在谈推荐理由:Cursor新版本基于Kimi 2.5原文