06:15marktechpost@Asif RazzaqVibeThinker-3B是一个3B参数的MIT许可证推理模型,基于Qwen2.5-Coder-3B构建。该模型采用Spectrum-to-Signal后训练流水线。在可验证基准上,它匹配了DeepSeek V3.2和Kimi K2.5的性能。AI模型VibeThinker-3BQwen2.5-Coder-3BDeepSeek V3.2Kimi K2.5推理模型2 个信源在谈推荐理由:3B参数就能比肩DeepSeek V3.2和Kimi K2.5,基于Qwen2.5-Coder-3B开源,适合资源受限场景的推理任务。原文
14:44rohanpaul_ai@rohanpaul_ai精选有人用单张RTX 3060 12GB GPU和768GB二手Intel Optane持久内存运行了1万亿参数的Kimi K2.5模型,速度超过4 tokens/sec。Kimi K2.5是混合专家模型,总参数1T但每token仅激活32B。RTX 3060的12GB VRAM处理路由、注意力等延迟敏感部分,专家权重存储在Optane PMem中,192GB DDR4 ECC作为缓存。Optane PMem延迟比最佳NVMe SSD低很多,但比DRAM慢2-3倍。llama.cpp通过override-tensor标志调整张量放置,实现混合GPU/CPU推理。AI模型Kimi K2.5混合专家模型推理模型开源/仓库大模型推荐理由:用旧硬件跑万亿模型,省钱又酷原文
07:26eric zakariasson@ericzakariasson83°Cursor 发布了 Composer 2.5,这是其编程代理模型的最新版本。在 Artificial Analysis 编程代理指数中,Composer 2.5 以 62 分排名第三,仅次于 Claude Opus 4.7 和 GPT-5.5,但成本仅为它们的 1/10 到 1/60。标准版每次任务仅需 0.07 美元,Fast 版 0.44 美元,而竞品高达 4 美元以上。在 SWE-Bench-Pro-Hard-AA 上,Composer 2.5 得分 47%,与 Claude Opus 4.7 相当,比上一代提升 35 个百分点。Fast 模式平均 6.7 分钟完成任务,是第三快的编程代理。该模型基于 Kimi K2.5 继续训练,Cursor 贡献了约 85% 的计算量,仅在 Cursor IDE 和 CLI 中可用。AI产品CursorComposer 2.5编程代理成本优化Kimi K2.510 个信源在谈推荐理由:Cursor 用 1/60 的成本实现了接近顶级模型的编程代理性能,做自动化开发或频繁使用 AI 编程的团队可以直接省下大笔费用,建议试试 Fast 模式感受响应速度。原文
07:46Fireworks AI@FireworksAI_HQ精选Fireworks AI 与 NotteCore 合作,在多个前沿模型上运行了 720 个浏览器代理任务。结果显示,某个基线模型在约 1/5 的调用中产生格式错误输出,导致多步工作流中频繁重试。而 Kimi K2.5、GLM-5 和 MiniMax M2.5 在 Fireworks 上运行时,重试率近乎为零,且随着任务步骤增加,延迟保持稳定。这一差异在生产级代理系统中直接体现为成本、延迟和可靠性的分化。完整报告已发布。AI产品浏览器代理模型对比重试率Kimi K2.5GLM-5MiniMax M2.5Fireworks3 个信源在谈推荐理由:做浏览器自动化或代理系统的团队,这个对比直接告诉你模型选择如何影响生产环境的成本和稳定性——Kimi/GLM/MiniMax 的低重试率值得关注。原文
13:55IT之家(博客/媒体)88°马斯克在推特上邀请用户测试 Cursor 最新 AI 模型 Composer 2.5,该模型基于月之暗面的 Kimi K2.5 训练,号称是 Cursor 最强模型。核心改进包括基于文本反馈的定向强化学习,能精准定位长任务中的错误步骤;合成任务规模扩大至 Composer 2 的 25 倍,并动态筛选更难任务。训练中使用了分片 Muon 与双网格 HSDP 等基础设施优化,单步耗时仅 0.2 秒。价格方面,标准版输入 0.50 美元/百万 token,输出 2.50 美元/百万 token;fast 版更贵但速度更快。AI产品CursorComposer 2.5Kimi K2.5强化学习编程助手10 个信源在谈推荐理由:Cursor 用户和 AI 编程重度依赖者值得关注——Composer 2.5 解决了长任务中错误定位的痛点,基于 Kimi K2.5 的强化学习让复杂指令执行更稳定,建议试试看能否提升你的编码效率。原文
10:41shao__meng@shao__meng83°Cursor 发布了 Composer 2.5 模型,仍然基于 Kimi K2.5,但通过三项关键训练创新实现了显著提升:定向文本反馈强化学习解决了长任务中的信用分配难题;合成训练数据量是 Composer 2 的 25 倍,其中 feature deletion 方法让模型从代码库中重新实现被删除的特性;基础设施层使用 Muon 优化器和分布式正交化,1T 模型单步仅需 0.2 秒。同时,Cursor 与 SpaceXAI 合作,马斯克亲自发帖证实 Composer 2.5 已开始使用 Colossus 2 算力训练,并正在合作从零训练一个算力规模 10 倍以上的全新模型。Composer 2.5 重点改进了长任务持续推进、复杂指令遵循和协作交互自然度,并专门优化了沟通风格和投入度校准两个现有 benchmark 难以衡量的维度。AI产品CursorComposer 2.5Kimi K2.5编程助手强化学习10 个信源在谈推荐理由:Cursor 这次在长任务和指令遵循上的改进,对重度使用 AI 编程助手的开发者来说体感会很直接,尤其是沟通风格和投入度校准这两个软维度优化,建议用 Composer 2.5 的团队直接试试。原文
08:38Fireworks AI@FireworksAI_HQ83°Cursor 团队在 Kimi K2.5 基础模型上相继推出了 Composer 2 和 Composer 2.5 版本。性能基准测试显示显著提升,其中 85% 的性能提升来自强化学习(RL)。Fireworks 为 RL 训练提供了算力支持。Composer 2.5 更智能,能更好处理长时间任务,更可靠地遵循复杂指令。未来一周,该模型的包含使用量将翻倍。AI产品CursorComposer 2.5Kimi K2.5强化学习编程助手10 个信源在谈推荐理由:Cursor 用户和 AI 编程重度使用者可以直接体验更智能的代码补全和长任务处理,性能提升主要靠 RL 而非堆参数,值得关注。原文
00:43Cursor@cursor_ai精选Cursor推出Composer 2.5,与Composer 2共享同一开源基础Moonshot的Kimi K2.5。该版本延续了开源架构,为用户提供更强大的代码生成能力。Cursor团队在X平台上宣布了这一更新,获得843个点赞和66816次查看。AI产品Composer 2.5Kimi K2.5CursorMoonshot编程助手10 个信源在谈推荐理由:Cursor新版本基于Kimi 2.5原文
11:46IT之家(博客/媒体)上海电信率先推出 Token 算力服务,成为上海首个发布 Token 资费套餐的运营商。套餐按量订购,1 元对应 25 万额度点,以 Kimi K2.5 大模型为例,约可支持 25 万输入 Tokens。用户可用话费账单支付,多买享折扣。上海电信手机号用户可免费体验 2500 万额度点(有效期一个月),6 月起“美好家”用户可享 Token 会员权益。用户购买额度点后,可通过标准 API 调用 30 余款主流大模型,集成到软件或自动化流程中。AI产品Token 资费上海电信Kimi K2.5API 集成算力服务推荐理由:运营商首次将 Token 作为可计费资源,降低了个人和中小企业使用大模型的门槛——用手机话费就能买算力,做 AI 应用开发或自动化脚本的团队可以直接用 API 集成,值得关注。原文