全部 AI 动态 · AI 热点

5月22日

02:12

rohanpaul_ai@rohanpaul_ai

83°

阿里巴巴发布了其最强旗舰模型 Qwen3.7-Max，专为真实世界任务和生产环境设计。该模型在智能体可靠性上做了核心优化，能够自主规划步骤、调用工具、检查结果并修复错误，不会在首次出错后崩溃。在 Artificial Analysis Intelligence Index 上，Qwen3.7-Max 得分 56.6，较 Qwen3.6-Max 提升 4.8 分，排名第五，与 GPT 5.4 相当。性能提升主要集中在科学推理、智能体能力和编程方面。此外，推理内核经过多轮底层 GPU 优化，实现了 10 倍的几何平均加速。

AI模型阿里 Qwen3.7-Max 智能体推理模型编程助手

推荐理由：Qwen3.7-Max 在智能体可靠性上的突破，让做自动化工作流和复杂任务编排的开发者有了更稳定的选择，建议直接上手测试。

原文

01:58

eric zakariasson@ericzakariasson

精选

Cursor 内部团队最常用的技能是热核代码质量审查，它要求删除复杂性而非移动代码。该审查会阻止超过 1000 行的文件，并标记薄包装和泄露的逻辑。它还会拒绝那些虽然能工作但使代码更混乱的 PR。

技巧 Cursor 编程助手代码审查代码质量

推荐理由：Cursor 团队分享代码审查狠招

原文

01:27

OpenRouter@OpenRouterAI

76°

AI模型 Qwen3.7-Max 阿里通义千问智能体编程助手 OpenRouter

推荐理由：做智能体开发或自动化办公的团队，Qwen3.7-Max 在编程和长任务执行上的提升值得一试，OpenRouter 上可直接体验。

原文

5月21日

23:05

berryxia@berryxia

Qwen 3.7 Max 正式发布，博主使用经典的「AI模型二叉树Prompt」对其进行了深度思考和快速模式测试。该Prompt要求模型编写HTML程序绘制递归分形二叉树，并实现生长动画和摇曳效果。测试结果通过视频展示，并与之前的Gemini 3.5 Flash结果进行了对比。用户可自行测试不同模型在该任务上的表现。

AI模型 Qwen 3.7 Max 推理模型编程助手模型评测分形二叉树

推荐理由：Qwen 3.7 Max 的发布值得关注，尤其是对AI模型编程能力感兴趣的开发者，可以用这个二叉树Prompt亲自测试它的表现，看看它和Gemini 3.5 Flash相比如何。

原文

22:15

阿里通义 Qwen@Alibaba_Qwen

阿里发布 Qwen3.7-Max 旗舰模型，在 Artificial Analysis Intelligence Index 上获得 56.6 分，比 Qwen3.6-Max-Preview 提升 4.8 分。主要改进集中在科学推理、智能体能力和编程能力，同时幻觉率大幅下降。模型上下文窗口从 256K 提升至 1M 令牌，但仅支持文本输入输出。虽然仍落后于 OpenAI、Anthropic 和 Google 的模型，但这是阿里最接近前沿模型的一次。

AI模型 Qwen3.7-Max 阿里推理模型智能体编程助手

推荐理由：阿里 Qwen 系列持续追赶前沿，Qwen3.7-Max 在推理和智能体能力上进步明显，做 AI 应用开发或模型选型的团队值得关注这次性能跃升。

原文

22:13

阿里通义 Qwen@Alibaba_Qwen

88°

阿里通义千问发布 Qwen3.7-Max，定位为智能体时代的旗舰基础模型。该模型在编码、办公助手、长时自主任务等方面表现突出，支持端到端前端原型、多文件重构、真实调试等场景。通过 MCP 集成和多智能体编排，可胜任可靠的生产力助手。在长达 35 小时的核优化任务中，自主调用超 1000 次工具，无需人工干预。模型兼容 Claude Code、OpenClaw、Qwen Code 等多种框架，API 已在阿里云 Model Studio 上线，用户也可在 Qwen Studio 体验。

AI模型 Qwen3.7-Max 智能体 MCP/工具编程助手多智能体

推荐理由：做智能体开发或自动化流程的团队，终于有了一个能连续跑 35 小时不翻车的基座模型，建议直接上 API 试试长任务场景。

原文

21:55

阿里云 Alibaba Cloud@alibaba_cloud

83°

阿里云发布了 Qwen3.7-Max 模型，在 Artificial Analysis Intelligence Index 上获得 56.6 分，比预览版 Qwen3.6-Max-Preview 提升了 4.8 分。该模型在科学推理、智能体能力、编程和减少幻觉方面均有显著改进。这标志着阿里在大模型领域的持续迭代和竞争力提升。

AI模型 Qwen3.7-Max 阿里云推理模型智能体编程助手

推荐理由：Qwen3.7-Max 在推理和智能体能力上大幅跃升，做 AI 应用开发和科学计算的团队值得关注，可以直接测试其编程和 agent 表现。

原文

18:34

Geek@geekbb

精选

一个新 zsh 插件通过模糊匹配和上下文预测提供行内命令补全。相比传统的 zsh-autosuggestions，它能更准确地预测用户意图，甚至处理拼写错误。该插件分析历史命令和当前终端状态动态生成建议。

AI产品 zsh-autosuggestions 模糊匹配上下文预测行内补全编程助手

推荐理由：模糊匹配补全，打错也能纠正

原文

17:11

Ate-a-Pi@svpino

91°

Claude Code 现在支持与 Codex 及其他智能体自主协作，实现多智能体协同工作。这一功能通过允许不同 AI 代理相互通信和分工，大幅提升了复杂任务的自动化处理能力。开发者可以配置 Claude Code 作为协调者，分配子任务给其他智能体，并整合结果。这标志着 AI 编程工具从单打独斗向团队协作的转变，可能改变软件开发流程。

AI产品 Claude Code Codex 智能体协作编程助手自动化

推荐理由：多智能体协作是 AI 编程的下一个前沿，做自动化工作流的开发者可以直接用这个功能搭建自己的 AI 团队，值得一试。

原文

13:37

rohanpaul_ai@rohanpaul_ai

76°

Meta 在 4 月 30 日的全员大会上泄露音频显示，公司正利用自家工程师的工作痕迹（包括代码编辑、测试、修复、工具选择等步骤）来训练编程 AI。扎克伯格认为，让模型观察“真正聪明的人”完成任务，比使用外包编写的示例数据更有效。这种“行为克隆”方法不仅教 AI 什么是正确代码，还教它如何从模糊任务逐步推导出解决方案。与此同时，Meta 计划裁员约 8000 人（占员工 10%），并将约 7000 人转向 AI 相关工作。这意味着人类专家的经验正在被转化为训练数据，然后被 AI 压缩吸收。

行业 Meta 编程助手行为克隆训练数据裁员

推荐理由：Meta 把自家工程师的思考过程变成训练数据，做 AI 编程或关注 AI 对就业影响的开发者值得细看——这可能是未来 AI 训练范式的转折点。

原文

10:48

宝玉的分享@宝玉

83°

Codex 官方团队分享了如何最大化利用 Codex 编程智能体的技巧，包括将其用于代码审查、自动化测试、生成文档等高级场景。文章强调，Codex 不仅能写代码，还能作为团队协作工具，提升开发效率。关键细节包括如何配置 Codex 以理解项目上下文、利用其生成 pull request 描述、以及结合 CI/CD 流程。这对希望从基础代码生成转向全流程自动化的开发者具有重要参考价值。

AI产品 Codex 编程助手自动化开发效率智能体

推荐理由：Codex 官方团队亲自拆解了从写代码到全流程自动化的进阶玩法，做 AI 编程的开发者看完能直接提升工具使用效率，建议点开对照自己的工作流优化。

原文

08:01

Anton Osika@antonosika

88°

Andrej Karpathy 在 X 上提出了一种新的编程方式“Vibe Coding”，即完全依赖 LLM（如 Cursor Composer + Sonnet）生成代码，开发者几乎不碰键盘、不读 diff、直接“Accept All”。遇到错误直接复制粘贴给 AI，甚至通过随机修改绕过 bug。Karpathy 认为这种方式适合周末项目，但代码会超出个人理解范围。这反映了 AI 编程工具能力提升后，开发者角色从“写代码”向“提需求”的转变。

AI产品 Vibe Coding AI编程 Cursor Composer 编程助手 Karpathy

推荐理由：Karpathy 把 AI 编程的极端体验说透了——如果你也习惯让 AI 写大部分代码、自己只动嘴，这篇会引发强烈共鸣；做原型或周末项目的开发者可以反思自己的“vibe coding”程度。

原文

08:01

@OpenAIDevs@OpenAIDevs

OpenAI 宣布 Codex 编程助手现已集成到 ChatGPT 移动应用中，用户可以在手机上直接进行代码问答和编程任务，并支持跨设备无缝衔接。这意味着开发者出门无需携带笔记本电脑，通过手机就能处理编程问题，回家后可在电脑上继续同一任务。该功能提升了 AI 编程助手的移动性和便捷性，尤其适合需要随时响应代码问题的开发者。

AI产品编程助手 Codex OpenAI 移动端跨设备

推荐理由：Codex 从桌面扩展到移动端，解决了开发者出门在外无法编程的痛点，做开发或技术支持的团队可以试试用手机快速处理代码问题，效率提升明显。

原文

08:00

08:00IT之家（博客/媒体）

83°

DeepSeek 已内部组建全新 Harness 团队，主攻代码智能体产品，直接对标 Anthropic 的 Claude Code。该团队由资深研究员陈德里证实，将专注研发 DeepSeek Code Harness，旨在将前沿模型能力转化为领先的 Agent 产品。目前开放 Harness 产品经理和研发工程师两个关键岗位，工作地点限北京。此举标志着 DeepSeek 正式进入代码智能体赛道，与 Claude Code 等产品展开竞争。

AI产品代码智能体 DeepSeek Claude Code Agent 产品编程助手

推荐理由：代码智能体是 AI 编程的下一个战场，DeepSeek 直接对标 Claude Code 组建 Harness 团队，做 AI 编程工具或 Agent 产品的开发者值得关注其后续动作。

原文

08:00

歸藏(guizang.ai)@op7418

72°

谷歌在 I/O 大会上宣布将 Antigravit 整个生态整合进 Gemini，Gemini CLI 更名为 Antigravit CLI，并发布对应 SDK。Antigravit 2.0 版本更像 Codex，而非 Cursor。实测 Gemini 3.5 Flash 配合 Antigravit 在排版上表现不错，但权限审批繁琐、缺少内置浏览器等细节体验不足。整体仍处于早期阶段，适合基础任务。

AI产品谷歌 I/O Antigravit Gemini 编程助手多模态

推荐理由：谷歌把 Antigravit 生态整合进 Gemini，做 AI 编程的开发者可以试试它的多模态排版能力，但别期待太复杂的自动化——权限和体验还差一截。

原文

08:00

Poe@poe_platform

72°

AI产品 Gemini-3.5-Flash Poe 编程助手智能体高效推理

推荐理由：做编程和智能体开发的团队终于有了一个轻量又高效的选择——Gemini-3.5-Flash 在 Poe 上直接可用，建议立即上手试试响应速度和任务处理能力。

原文

07:59

The Rundown AI@therundownai

今日AI领域多则重要消息：马斯克起诉OpenAI和微软的诉讼被驳回，法院认定OpenAI未违反反垄断法。Cursor的Composer 2.5版本在编程能力上接近前沿水平，能更高效地处理复杂代码任务。Claude与Blender结合，可实现3D模型生成。Odyssey推出多模态、多人世界模型。此外还有4款新AI工具和社区工作流发布。

行业马斯克 OpenAI Cursor 编程助手 3D模型

推荐理由：马斯克诉OpenAI案结果影响AI行业竞争格局，关注AI治理的读者值得了解。Cursor Composer 2.5接近编程前沿，做开发的团队可以直接体验提升效率。

原文

07:59

Noam Shazeer@noamshazeer

91°

在 Google IO 大会上，Noam Shazeer 宣布推出 Gemini 3.5 Flash 模型，专为智能体和编程场景优化。该模型具备前沿性能，速度是其他前沿模型的 4 倍，即日起全球上线。这标志着 Google 在实时 AI 应用领域的重要进展，尤其适合需要快速响应的智能体工作流。

AI模型 Gemini 3.5 Flash 智能体编程助手 Google IO 推理模型

推荐理由：做智能体开发和编程的团队终于有了速度与性能兼得的选择——Gemini 3.5 Flash 比同类快 4 倍，值得立即上手测试。

原文

07:59

Sualeh Asif@sualehasif996

83°

Cursor 宣布与 SpaceXAI 合作，从零开始训练一个显著更大的模型，总计算量是之前的 10 倍。双方将利用 Colossus 2 集群的百万 H100 等效算力，结合各自的数据和训练技术，预计模型能力将有重大飞跃。这一合作表明 AI 编程工具正在向更底层、更强大的基础模型进军，可能带来编程助手能力的质变。

AI产品 Cursor SpaceXAI 大模型编程助手算力提升

推荐理由：Cursor 用户和 AI 编程重度依赖者值得关注——更大模型意味着更智能的代码生成和上下文理解，算力 10 倍提升可能带来体验的质变，建议持续跟踪后续发布。

原文

00:08

SiliconFlowAI@siliconflowai

CC Switch 是一个统一管理多个 CLI 工具（如 Claude Code、Gemini CLI、Codex、OpenCode、OpenClaw、Hermes Agent）的界面，解决了开发者需要在不同 CLI 间切换配置文件的痛点。现在 SiliconFlow 成为其内置预设提供商，支持一键启用 DeepSeek V4、GLM 5.1、Kimi K2.6、MiniMax M2.5 等模型。这意味着开发者无需手动配置多个 CLI 的环境变量或 API 密钥，直接在 CC Switch 中选择预设即可切换模型。对于使用多种 AI 编程助手的团队或个人，这能大幅减少配置管理时间。

AI产品 CLI 管理 SiliconFlow DeepSeek V4 编程助手配置工具

推荐理由：CC Switch 解决了多 CLI 配置管理的碎片化问题，做 AI 编程或智能体开发的团队不用再手动切换环境变量，直接一键启用 SiliconFlow 预设就能用上 DeepSeek V4 等新模型，建议试试。

原文

5月20日

13:40

13:40IT之家（博客/媒体）

88°

阿里千问今日正式发布 Qwen3.7-Max，定位为面向智能体时代的旗舰模型，即将通过阿里云百炼 API 提供服务。该模型在编程、办公自动化、长周期自主执行等智能体任务上表现突出，例如在长达 35 小时、超 1000 次工具调用的内核优化实验中保持连贯推理。在多项基准测试中，Qwen3.7-Max 在编程智能体（如 SWE-Pro 60.6）、通用智能体（如 MCP-Mark 60.8）和推理（如 GPQA Diamond 92.4）上均取得领先或与顶尖模型相当的成绩。此外，它支持跨框架部署，兼容 Claude Code、OpenClaw 等，并具备多语言理解与翻译能力。

AI模型智能体编程助手 MCP/工具推理模型 Qwen3.7-Max

推荐理由：Qwen3.7-Max 在长周期自主执行和跨框架兼容性上展现出实用价值，做自动化办公或复杂编程的开发者可以直接通过 API 体验，值得关注。

原文

11:00

rohanpaul_ai@rohanpaul_ai

83°

Google 的 Gemini 3.5 Flash 模型在多个真实工作自动化测试中超越了上一代旗舰 Gemini 3.1 Pro。其输出速度提升 4 倍，且在 Terminal-Bench 2.1、MCP Atlas 等硬核智能体和编程基准测试中表现更优。该模型已集成到 Gemini 应用、搜索 AI 模式、API、Antigravity、Android Studio 及企业智能体产品中。结合更新的 Antigravity 框架，3.5 Flash 能高效部署协作子智能体，例如一个子智能体检查文件夹、另一个重写代码、第三个测试结果、第四个总结变更。这使得它成为日常工作中既快又便宜的强大智能体模型。

AI模型 Gemini 3.5 Flash 智能体自动化测试编程助手 Antigravity

推荐理由：做自动化测试和智能体开发的团队终于有了又快又便宜的选择——Gemini 3.5 Flash 在多个硬核基准上超越旗舰 Pro，输出速度还快 4 倍，建议直接上手试。

原文

09:10

shao__meng@shao__meng

83°

Google 在 I/O 大会上发布了 Gemini 3.5 Flash 模型，各项评测几乎全面超越之前的 Gemini 3.1 Pro，且速度更快、成本更低。Gemini 3.5 是 Google 最新的模型系列，结合前沿智能与现实行动能力，特别强化了智能体和编程能力。这次发布距离 Gemini 3.1 仅数月，显示出 Google 在 AI 模型上的快速迭代。对于开发者而言，这意味着更高效、更便宜的模型选择。

AI模型 Gemini 3.5 Google 智能体编程助手模型迭代

推荐理由：Gemini 3.5 Flash 在评测中碾压自家 3.1 Pro，还更快更便宜，做智能体和编程的开发者值得关注——Google 终于拿出了能打的模型。

原文

06:53

Jeff Dean@JeffDean

83°

Google 在 #GoogleIO 上发布了 Gemini 3.5 Flash 模型，主打快速与高能力的结合。该模型在几乎所有基准测试上优于 3.1 Pro，尤其在编程方面有巨大进步。其输出速度是其他前沿模型的 4 倍，智能与速度的平衡使其在同类模型中独树一帜。Gemini 3.5 Flash 即日起在 @antigravity 及 Google 产品和 API 中可用。

AI模型 Gemini 3.5 Flash Google 推理模型编程助手速度

推荐理由：对于需要快速响应的 AI 应用开发者来说，Gemini 3.5 Flash 在速度和能力上找到了新平衡点，编程任务尤其受益，建议立即试用。

原文

06:44

Patrick Loeber@patloeber

83°

Google 的 Gemini 3.5 Flash 模型现已正式可用（GA），在智能体和编程任务上达到前沿水平。该模型在复杂长周期任务中表现出色，并在多个挑战性基准测试中超越了上一代 3.1 Pro。同时，它保持了极快的推理速度，适合对延迟敏感的应用场景。开发者可以立即在 Google AI Studio 或 Vertex AI 上使用。

AI模型 Gemini 3.5 Flash 智能体编程助手推理模型 Google

推荐理由：做智能体或编程自动化的开发者终于有了一个又快又强的模型——Gemini 3.5 Flash 在长任务和基准上超越 3.1 Pro，且已 GA 可直接用，建议立刻上手试试。

原文

03:26

GitHub@github

76°

Google AI 的 Gemini 3.5 Flash 模型现已正式发布，并开始在 GitHub Copilot 中逐步推出。早期测试显示，该模型在工具使用、响应速度和缓存效率方面表现突出，特别适合快速迭代的智能体编码工作流。开发者可以直接在 GitHub Copilot 中尝试使用。

AI产品 Gemini 3.5 Flash GitHub Copilot 智能体编程助手 Google AI

推荐理由：对于使用 GitHub Copilot 的开发者，Gemini 3.5 Flash 带来了更快的响应和高效的缓存，能显著提升智能体编程体验，建议立即在 Copilot 中切换试试。

原文

03:24

03:24IT之家（博客/媒体）

83°

谷歌在2026 I/O大会上发布Antigravity 2.0，将其从智能体式IDE升级为通用智能体工作平台，支持多智能体协同编程和定时任务调度。新增斜杠命令如/goal、/grill-me、/browser提升任务可控性，并取消代码仓库强绑定，改为按项目组织会话。同步推出Antigravity CLI和Managed Agents，后者可通过一次API请求启动隔离Linux环境中的智能体，支持状态持久化。Google AI Studio移动应用开放预注册，支持生成完整Android应用并直接导出到Google Play Console。

AI产品多智能体编程助手定时任务 Antigravity 谷歌

推荐理由：多智能体协同和定时任务让复杂编程自动化更高效，做多任务编排的开发者可以直接用新斜杠命令提升可控性。

原文

03:18

Google DeepMind@GoogleDeepMind

91°

Google DeepMind 正式推出 Gemini 3.5 系列模型，首发版本为 3.5 Flash，号称是迄今为止最强的智能体与编程模型。该模型将前沿智能与现实世界行动能力相结合，专为智能体应用和代码生成场景优化。这一发布标志着 Google 在 AI 模型竞争中进一步强化了实用性和行动能力，对开发者社区和智能体生态有重要影响。

AI模型 Gemini 3.5 智能体编程助手 Google DeepMind 模型发布

推荐理由：做智能体或编程工具的开发者终于有了一个专为行动而生的前沿模型——Gemini 3.5 Flash 直接瞄准了实际应用场景，值得立即上手体验。

原文

02:58

OpenRouter@OpenRouterAI

83°

Google DeepMind 正式推出 Gemini 3.5 系列模型，首发版本为 3.5 Flash，号称是该公司迄今为止最强的智能体和编程模型。该模型将前沿智能与现实行动能力结合，旨在提升 AI 在复杂任务中的自主执行能力。OpenRouter 已同步支持该模型，用户可直接体验。这一发布标志着 Google 在智能体与代码生成领域的重要进展。

AI模型 Gemini 3.5 智能体编程助手 Google DeepMind OpenRouter

推荐理由：做智能体开发或编程自动化的团队值得关注——Gemini 3.5 Flash 把行动能力直接集成到模型里，OpenRouter 上已经能用，建议试试效果。

原文

02:43

Jeff Dean@JeffDean

91°

Google 在 I/O 大会上发布 Gemini 3.5 系列，首推 3.5 Flash 模型。该模型专为复杂、长周期的智能体工作流设计，在 Terminal-Bench 和 MCP Atlas 等智能体与编程基准上超越 3.1 Pro，运行速度比其他前沿模型快 4 倍。在 Google Antigravity 中优化后，速度可提升至 12 倍。它可作为子智能体协作、高频迭代循环的强大引擎，用于大规模解决实际问题。

AI模型 Gemini 3.5 Flash 智能体编程助手 Google I/O 推理模型

推荐理由：做复杂智能体编排和编程自动化的开发者，终于有了一个又快又强的模型引擎——Gemini 3.5 Flash 在基准上超越前代，速度还快 4 倍，值得立刻上手试。

原文

02:42

Philipp Schmid@_philschmid

83°

Google 宣布 Gemini 3.5 Flash 模型正式全面可用。该模型在编程和智能体任务上超越 Gemini 3.1 Pro，支持 100 万 token 上下文窗口和 6.5 万 token 最大输出，输出速度提升 4 倍。提供四种思考级别（minimal、low、medium、high），并自动保留多轮对话中的思考过程。现已登陆 Google AI Studio、Android Studio、Gemini 企业版等多个平台。

AI模型 Gemini 3.5 Flash 推理模型智能体编程助手 Google

推荐理由：做智能体开发和编程的团队终于有了更快的 Flash 模型——速度提升 4 倍且支持长上下文，建议在 AI Studio 里直接试试 medium 思考级别。

原文

5月19日

17:28

Together AI@togethercompute

78°

Cursor 团队发布了 Composer 2.5，这是一款面向智能体编程的模型，标志着编程助手领域的重要进展。Together AI 作为 AI 原生云服务商，参与了此次合作发布。Composer 2.5 在速度和生成质量上表现突出，正在引领编程智能体的新潮流。

AI产品编程助手智能体 Cursor Together AI Composer 2.5

推荐理由：编程开发者和 AI 编程工具用户值得关注——Composer 2.5 提升了智能体编程的速度和质量，做自动化代码生成的团队可以直接体验。

原文

14:19

Sualeh Asif@sualehasif996

72°

Cursor 团队宣布推出 Composer 2.5，这是其最强大的模型版本。该模型在强化学习（RL）方面取得显著进步，智能水平更高，能更好地处理长时间运行的任务，并更可靠地遵循复杂指令。为庆祝发布，未来一周内用户可享受双倍模型使用额度。团队正与 SpaceXAI 合作，计划在下一版本中进一步扩展模型规模和计算量。

AI产品 Cursor Composer 2.5 强化学习编程助手模型升级

推荐理由：Cursor 用户将直接受益于更强的代码生成和任务执行能力，尤其是处理复杂、长期项目时体验提升明显。建议立即体验双倍额度，感受 RL 优化带来的实际效果。

原文

13:55

13:55IT之家（博客/媒体）

88°

马斯克在推特上邀请用户测试 Cursor 最新 AI 模型 Composer 2.5，该模型基于月之暗面的 Kimi K2.5 训练，号称是 Cursor 最强模型。核心改进包括基于文本反馈的定向强化学习，能精准定位长任务中的错误步骤；合成任务规模扩大至 Composer 2 的 25 倍，并动态筛选更难任务。训练中使用了分片 Muon 与双网格 HSDP 等基础设施优化，单步耗时仅 0.2 秒。价格方面，标准版输入 0.50 美元/百万 token，输出 2.50 美元/百万 token；fast 版更贵但速度更快。

AI产品 Cursor Composer 2.5 Kimi K2.5 强化学习编程助手

推荐理由：Cursor 用户和 AI 编程重度依赖者值得关注——Composer 2.5 解决了长任务中错误定位的痛点，基于 Kimi K2.5 的强化学习让复杂指令执行更稳定，建议试试看能否提升你的编码效率。

原文

12:53

Clement Delangue@ClementDelangue

76°

Cursor 发布了其最强模型 Composer 2.5，声称更智能、更擅长处理长时间任务，并能更可靠地遵循复杂指令。Hugging Face CEO Clement Delangue 评论称，所有严肃的 AI 公司最终都会基于开源自研模型，而非通过 API 外包。为推广新模型，Cursor 将在接下来一周内加倍该模型的免费使用额度。这一举措反映了 AI 行业从依赖第三方 API 转向自研模型的趋势。

AI产品 Cursor Composer 2.5 自研模型编程助手开源

推荐理由：Cursor 自研模型 Composer 2.5 提升了长任务处理能力，做 AI 编程的开发者可以直接体验翻倍额度，感受自研模型带来的效率变化。

原文

12:39

Greg Brockman@gdb

精选76°

OpenAI 的 Derrick Choi 团队撰文介绍了 Codex 中 /goal 命令的使用方法。该命令能让 Codex 持续工作直到目标被解决，而不是一次性地生成代码。文章详细说明了何时使用 Goals、激活 Goal 后会发生什么变化，以及如何编写具有清晰结果、约束条件和验证标准的 Goals。此外，还从架构层面解释了 Goals 的设计原理。这一功能对于需要长期、复杂任务自动化的开发者来说非常实用。

AI产品 Codex Goal 自动化编程助手 OpenAI

推荐理由：Codex 的 /goal 命令解决了长任务执行痛点，做复杂自动化的开发者可以直接试。

原文

11:49

Cursor@cursor_ai

76°

Cursor 宣布与 SpaceXAI 合作，从零开始训练一个显著更大的模型，总计算量提升 10 倍。双方将利用 Colossus 2 集群的百万 H100 等效算力，结合各自的数据与训练技术，预期实现模型能力的重大飞跃。这一合作表明 AI 编程工具正加速向更大规模、更强能力的模型演进，可能带来更智能的代码生成与理解能力。

AI产品 Cursor SpaceXAI 编程助手大模型训练算力提升

推荐理由：AI 编程工具正在从“辅助”走向“自主”，Cursor 这次联手 SpaceXAI 把算力堆到 10 倍，做 AI 编程或模型训练的开发者值得关注——这可能是下一代编程助手的雏形。

原文

11:21

小互@imxiaohu

83°

Cursor 发布了自研编码模型 Composer 2.5，在性能上与 OpenAI 的 Opus 4.7 相当，评分差距不到 1 分，但价格大幅降低：输入 token 便宜 10 倍，输出 token 便宜 30 倍。相比前代 Composer 2，新模型在长时间任务、复杂指令遵循和协作顺滑度上有明显提升，能稳定处理数十万 token 的长任务。这一突破让开发者以更低成本获得顶级编码能力，尤其适合需要持续迭代的复杂项目。

AI产品 Cursor Composer 2.5 编码模型成本优化编程助手

推荐理由：Cursor 用自研模型把编码成本打到了 Opus 的 1/30，做复杂项目或长任务开发的团队可以直接省下大笔 API 费用，性能还几乎没缩水，值得立刻试。

原文

10:41

shao__meng@shao__meng

83°

Cursor 发布了 Composer 2.5 模型，仍然基于 Kimi K2.5，但通过三项关键训练创新实现了显著提升：定向文本反馈强化学习解决了长任务中的信用分配难题；合成训练数据量是 Composer 2 的 25 倍，其中 feature deletion 方法让模型从代码库中重新实现被删除的特性；基础设施层使用 Muon 优化器和分布式正交化，1T 模型单步仅需 0.2 秒。同时，Cursor 与 SpaceXAI 合作，马斯克亲自发帖证实 Composer 2.5 已开始使用 Colossus 2 算力训练，并正在合作从零训练一个算力规模 10 倍以上的全新模型。Composer 2.5 重点改进了长任务持续推进、复杂指令遵循和协作交互自然度，并专门优化了沟通风格和投入度校准两个现有 benchmark 难以衡量的维度。

AI产品 Cursor Composer 2.5 Kimi K2.5 编程助手强化学习

推荐理由：Cursor 这次在长任务和指令遵循上的改进，对重度使用 AI 编程助手的开发者来说体感会很直接，尤其是沟通风格和投入度校准这两个软维度优化，建议用 Composer 2.5 的团队直接试试。

原文

09:52

berryxia@berryxia

88°

Cursor 发布了 Composer 2.5 模型，宣称是目前最强大的模型，具备更聪明的推理、更强的长任务持续能力和更可靠的复杂指令执行。该模型在同等能力下实现了10倍效率提升，底层基于与 Moonshot Kimi K2.5 相同的开源架构。训练规模扩大、强化学习环境更复杂，并加入了文本反馈机制，使模型能在长 rollout 中快速学习。Cursor 已与 SpaceXAI 合作，计划用10倍算力训练更大模型。下周还将翻倍模型用量。

AI产品 Cursor Composer 2.5 编程助手开源/仓库推理模型

推荐理由：Composer 2.5 解决了 AI 编程中长任务容易崩、指令执行飘的痛点，做复杂代码开发的团队可以直接体验10倍效率提升，建议点开看看具体架构和用量翻倍细节。

原文