全部 AI 动态 · AI 热点

6月20日

06:15

marktechpost@Asif Razzaq

VibeThinker-3B是一个3B参数的MIT许可证推理模型，基于Qwen2.5-Coder-3B构建。该模型采用Spectrum-to-Signal后训练流水线。在可验证基准上，它匹配了DeepSeek V3.2和Kimi K2.5的性能。

AI模型 VibeThinker-3B Qwen2.5-Coder-3B DeepSeek V3.2 Kimi K2.5 推理模型

推荐理由：3B参数就能比肩DeepSeek V3.2和Kimi K2.5，基于Qwen2.5-Coder-3B开源，适合资源受限场景的推理任务。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月24日

14:44

rohanpaul_ai@rohanpaul_ai

精选

有人用单张RTX 3060 12GB GPU和768GB二手Intel Optane持久内存运行了1万亿参数的Kimi K2.5模型，速度超过4 tokens/sec。Kimi K2.5是混合专家模型，总参数1T但每token仅激活32B。RTX 3060的12GB VRAM处理路由、注意力等延迟敏感部分，专家权重存储在Optane PMem中，192GB DDR4 ECC作为缓存。Optane PMem延迟比最佳NVMe SSD低很多，但比DRAM慢2-3倍。llama.cpp通过override-tensor标志调整张量放置，实现混合GPU/CPU推理。

AI模型 Kimi K2.5 混合专家模型推理模型开源/仓库大模型

推荐理由：用旧硬件跑万亿模型，省钱又酷

原文

5月22日

07:26

eric zakariasson@ericzakariasson

83°

Cursor 发布了 Composer 2.5，这是其编程代理模型的最新版本。在 Artificial Analysis 编程代理指数中，Composer 2.5 以 62 分排名第三，仅次于 Claude Opus 4.7 和 GPT-5.5，但成本仅为它们的 1/10 到 1/60。标准版每次任务仅需 0.07 美元，Fast 版 0.44 美元，而竞品高达 4 美元以上。在 SWE-Bench-Pro-Hard-AA 上，Composer 2.5 得分 47%，与 Claude Opus 4.7 相当，比上一代提升 35 个百分点。Fast 模式平均 6.7 分钟完成任务，是第三快的编程代理。该模型基于 Kimi K2.5 继续训练，Cursor 贡献了约 85% 的计算量，仅在 Cursor IDE 和 CLI 中可用。

AI产品 Cursor Composer 2.5 编程代理成本优化 Kimi K2.5

推荐理由：Cursor 用 1/60 的成本实现了接近顶级模型的编程代理性能，做自动化开发或频繁使用 AI 编程的团队可以直接省下大笔费用，建议试试 Fast 模式感受响应速度。

原文

5月21日

07:46

Fireworks AI@FireworksAI_HQ

精选

Fireworks AI 与 NotteCore 合作，在多个前沿模型上运行了 720 个浏览器代理任务。结果显示，某个基线模型在约 1/5 的调用中产生格式错误输出，导致多步工作流中频繁重试。而 Kimi K2.5、GLM-5 和 MiniMax M2.5 在 Fireworks 上运行时，重试率近乎为零，且随着任务步骤增加，延迟保持稳定。这一差异在生产级代理系统中直接体现为成本、延迟和可靠性的分化。完整报告已发布。

AI产品浏览器代理模型对比重试率 Kimi K2.5 GLM-5 MiniMax M2.5 Fireworks

推荐理由：做浏览器自动化或代理系统的团队，这个对比直接告诉你模型选择如何影响生产环境的成本和稳定性——Kimi/GLM/MiniMax 的低重试率值得关注。

原文

5月19日

13:55

13:55IT之家（博客/媒体）

88°

马斯克在推特上邀请用户测试 Cursor 最新 AI 模型 Composer 2.5，该模型基于月之暗面的 Kimi K2.5 训练，号称是 Cursor 最强模型。核心改进包括基于文本反馈的定向强化学习，能精准定位长任务中的错误步骤；合成任务规模扩大至 Composer 2 的 25 倍，并动态筛选更难任务。训练中使用了分片 Muon 与双网格 HSDP 等基础设施优化，单步耗时仅 0.2 秒。价格方面，标准版输入 0.50 美元/百万 token，输出 2.50 美元/百万 token；fast 版更贵但速度更快。

AI产品 Cursor Composer 2.5 Kimi K2.5 强化学习编程助手

推荐理由：Cursor 用户和 AI 编程重度依赖者值得关注——Composer 2.5 解决了长任务中错误定位的痛点，基于 Kimi K2.5 的强化学习让复杂指令执行更稳定，建议试试看能否提升你的编码效率。

原文

10:41

shao__meng@shao__meng

83°

Cursor 发布了 Composer 2.5 模型，仍然基于 Kimi K2.5，但通过三项关键训练创新实现了显著提升：定向文本反馈强化学习解决了长任务中的信用分配难题；合成训练数据量是 Composer 2 的 25 倍，其中 feature deletion 方法让模型从代码库中重新实现被删除的特性；基础设施层使用 Muon 优化器和分布式正交化，1T 模型单步仅需 0.2 秒。同时，Cursor 与 SpaceXAI 合作，马斯克亲自发帖证实 Composer 2.5 已开始使用 Colossus 2 算力训练，并正在合作从零训练一个算力规模 10 倍以上的全新模型。Composer 2.5 重点改进了长任务持续推进、复杂指令遵循和协作交互自然度，并专门优化了沟通风格和投入度校准两个现有 benchmark 难以衡量的维度。

AI产品 Cursor Composer 2.5 Kimi K2.5 编程助手强化学习

推荐理由：Cursor 这次在长任务和指令遵循上的改进，对重度使用 AI 编程助手的开发者来说体感会很直接，尤其是沟通风格和投入度校准这两个软维度优化，建议用 Composer 2.5 的团队直接试试。

原文

08:38

Fireworks AI@FireworksAI_HQ

83°

Cursor 团队在 Kimi K2.5 基础模型上相继推出了 Composer 2 和 Composer 2.5 版本。性能基准测试显示显著提升，其中 85% 的性能提升来自强化学习（RL）。Fireworks 为 RL 训练提供了算力支持。Composer 2.5 更智能，能更好处理长时间任务，更可靠地遵循复杂指令。未来一周，该模型的包含使用量将翻倍。

AI产品 Cursor Composer 2.5 Kimi K2.5 强化学习编程助手

推荐理由：Cursor 用户和 AI 编程重度使用者可以直接体验更智能的代码补全和长任务处理，性能提升主要靠 RL 而非堆参数，值得关注。

原文

00:43

Cursor@cursor_ai

精选

Cursor推出Composer 2.5，与Composer 2共享同一开源基础Moonshot的Kimi K2.5。该版本延续了开源架构，为用户提供更强大的代码生成能力。Cursor团队在X平台上宣布了这一更新，获得843个点赞和66816次查看。

AI产品 Composer 2.5 Kimi K2.5 Cursor Moonshot 编程助手

推荐理由：Cursor新版本基于Kimi 2.5

原文

5月16日

11:46

11:46IT之家（博客/媒体）

上海电信率先推出 Token 算力服务，成为上海首个发布 Token 资费套餐的运营商。套餐按量订购，1 元对应 25 万额度点，以 Kimi K2.5 大模型为例，约可支持 25 万输入 Tokens。用户可用话费账单支付，多买享折扣。上海电信手机号用户可免费体验 2500 万额度点（有效期一个月），6 月起“美好家”用户可享 Token 会员权益。用户购买额度点后，可通过标准 API 调用 30 余款主流大模型，集成到软件或自动化流程中。

AI产品 Token 资费上海电信 Kimi K2.5 API 集成算力服务

推荐理由：运营商首次将 Token 作为可计费资源，降低了个人和中小企业使用大模型的门槛——用手机话费就能买算力，做 AI 应用开发或自动化脚本的团队可以直接用 API 集成，值得关注。

原文