全部 AI 动态 · AI 热点

6月4日

01:28

SiliconFlowAI@siliconflowai

83°

SiliconFlow 宣布将 OpenRouter 上排名第一的编程智能体 Hermes Agent 集成到 Discord 服务器中。用户可以通过 Discord 直接使用该智能体进行编程任务，无需额外设置。Hermes Agent 由 NousResearch 开发，在 OpenRouter 上表现优异。SiliconFlow 提供了详细的设置步骤、模型选择建议和专业技巧，帮助用户快速上手。这一集成让编程助手更易访问，适合团队协作场景。

AI产品编程助手智能体 Discord 集成 Hermes Agent SiliconFlow

推荐理由：编程团队终于可以在 Discord 里直接调用顶级智能体了——Hermes Agent 在 OpenRouter 上排名第一，做协作开发的团队建议试试这个集成，省去切换工具的麻烦。

原文

00:31

阶跃星辰 Stepfun@Stepfun_AI

Step 3.7 Flash 模型专为真实世界的智能体编程任务设计，不仅追求代码生成速度，更注重在复杂输出中保持逻辑、视觉和执行的一致性。该模型在演示中展示了其在多步骤、多模态任务中的连贯性，适合需要高可靠性的编程场景。开发者 @atomic_chat_hq 的创意测试进一步验证了其能力。

AI模型智能体编程助手推理模型 Step 3.7 Flash 多模态

推荐理由：做智能体编程的开发者终于有了一个兼顾速度和一致性的模型——Step 3.7 Flash 在复杂任务中保持逻辑连贯，值得在真实项目中试试。

原文

6月3日

23:42

OpenRouter@OpenRouterAI

OpenRouter 的 Pareto Router 目前每天处理近 10 亿 tokens，而 Auto Router 处理 120 亿 tokens。Pareto Router 专为编程场景设计，用户只需设定智能水平和成本上限，系统会自动选择最佳模型。这为 AI 编程用户提供了一种高效节省成本的方式，同时 Workspaces 功能支持设置最大使用量。该工具被评价为最被低估的 AI 编程成本节省方案。

AI产品 OpenRouter Pareto Router 编程助手成本优化模型路由

推荐理由：AI 编程用户想省成本又不想牺牲效果，Pareto Router 直接帮你选最优模型，比手动调模型省心太多，建议试试。

原文

23:11

向阳乔木@vista8

如果你在多台电脑上安装了 Codex 并登录同一个 ChatGPT 账号，可以在设置中通过“连接 - 控制其他设备”添加其他电脑。设置后，本机创建项目时可以选择添加远程项目，从而远程控制家中电脑的 Codex 工作。这个功能让多设备协作更灵活，适合需要在不同地点使用 Codex 的开发者。

技巧 Codex 远程控制多设备协作编程助手小技巧

推荐理由：多设备用户终于不用来回切换了——远程控制另一台电脑的 Codex 写代码，省去物理移动的麻烦，有多个工作站的开发者可以直接试试这个隐藏功能。

原文

21:03

Simon Willison@simonw

据报道，Uber 对每位员工使用的每款编程助手工具设定了每月 1500 美元的费用上限。这一举措反映了企业对 AI 编程工具成本控制的重视，同时也暗示了 Uber 认为这些工具能带来的实际价值。该消息由开发者 Simon Willison 在 X 平台分享，引发了关于企业如何平衡 AI 工具投入与回报的讨论。对于其他公司而言，这可能是一个参考案例，表明在推广 AI 编程助手时，需要建立合理的预算和评估机制。

行业编程助手成本控制 Uber 企业实践 AI 工具

推荐理由：Uber 的定价上限给所有引入 AI 编程助手的团队提了个醒——工具虽好，但成本控制不能少。做技术选型和预算管理的开发者值得关注这个真实案例。

原文

16:04

Ate-a-Pi@svpino

精选

开发者 Santiago 分享了一个 Claude Code 的使用技巧：当上下文利用率超过 60% 时，模型性能会下降，且自动压缩可能丢失重要信息。他建议通过 /statusline 命令实时监控上下文百分比，并在超过阈值时手动运行 /compact 命令，附带提示词指定保留内容（如项目描述和变更指令）。这样能更精准地控制上下文压缩，避免关键信息丢失。

技巧 Claude Code 上下文管理压缩技巧效率提升编程助手

推荐理由：Claude Code 重度用户经常遇到上下文溢出导致模型变笨的问题，这个 60% 规则和手动压缩技巧能帮你精准控制保留内容，避免自动压缩丢失关键信息，建议试试。

原文

14:15

AI Will@FinanceYF5

88°

Anthropic 正在使用 1000 名自由软件工程师来训练其编程助手 Claude Code。每位工程师每完成一个任务可获得 280 美元，任务包括编写提示词、比较代码、测试后续交互，以及向 Claude 展示真实开发者的工作方式。这一做法旨在提升 Claude Code 的代码生成质量和开发流程理解能力。消息引发讨论，有人担忧 AI 训练正在“烹饪”人类自身，即人类在帮助 AI 取代自己的岗位。

AI产品 Claude Code 编程助手 Anthropic AI训练自由工程师

推荐理由：Anthropic 用真实开发者训练 Claude Code，揭示了 AI 编程助手背后的数据来源和成本结构，做 AI 训练或关注编程工具演进的开发者值得了解——这直接关系到未来谁在写代码。

原文

14:12

AI Will@FinanceYF5

72°

Anthropic 正在大规模招募 1000 名自由职业软件工程师，专门用于训练其编程助手 Claude Code。每完成一个任务可获得 280 美元报酬，工程师们需要编写提示词、比对代码输出、测试模型的追问响应，并教会 Claude 真实开发者的工作方式。这一举措旨在提升 Claude Code 在真实编程场景中的表现，但也引发了关于 AI 可能取代部分编程工作的讨论。对于开发者而言，这既是参与前沿 AI 训练的机会，也反映了行业对高质量训练数据的需求。

AI产品 Anthropic Claude Code 编程助手自由职业 AI训练

推荐理由：Anthropic 用真金白银请工程师教 Claude 写代码，做 AI 训练或编程工具的团队值得关注——这揭示了高质量训练数据的新模式，也暗示了未来编程工作的形态变化。

原文

13:48

Mustafa Suleyman@mustafasuleyman

88°

微软CEO Mustafa Suleyman宣布推出7款全新MAI系列模型，包括文本基础模型MAI-Thinking-1、图像模型MAI-Image-2.5及高效编程模型MAI-Code-1-Flash。MAI-Thinking-1拥有350亿激活参数的MoE架构，256K上下文窗口，在AIME 2025上达到97%，SWE Bench Pro上53%，与Opus 4.6持平，且盲测中整体质量优于Sonnet 4.6。该模型针对微软自研MAIA 200芯片优化，性能每美元提升30%，每瓦性能提升1.4倍。MAI-Code-1-Flash仅5B参数，SWE Bench Pro达51%，成本更低。微软还推出Frontier Tuning服务，允许企业定制专属模型，早期案例中为McKinsey定制模型以10倍低成本超越GPT-5.5。

AI模型 MAI-Thinking-1 MAI-Code-1-Flash MAI-Image-2.5 推理模型编程助手

推荐理由：微软一口气推出7款新模型，覆盖推理、编程、图像三大方向，MAI-Thinking-1在推理和编码上直接对标Claude Sonnet 4.6和Opus 4.6，做AI应用或企业定制化模型的团队值得关注——尤其是Frontier Tuning让企业用更低成本获得超越GPT-5.5的效果。

原文

11:52

Cognition@cognition_labs

88°

Cognition 发布了 Devin Desktop，一个统一的桌面界面，允许用户从单一界面管理本地和云端的智能体集群。用户可以在不离开编辑器的情况下完成规划、委托、审查和发布等操作。这标志着 AI 编程助手从单一工具向多智能体协作平台的演进，提升了开发者的工作效率。

AI产品智能体编程助手 Devin 桌面应用多智能体管理

推荐理由：Devin Desktop 解决了多智能体管理分散的痛点，做复杂开发流程的团队可以直接用，建议点开看看如何统一调度。

原文

10:49

GitHub@github

精选76°

GitHub 宣布 Copilot SDK 现已正式可用，提供稳定 API 和生产级支持。开发者可将 Copilot 的智能引擎嵌入自己的应用、服务和开发工具中。这意味着第三方工具和平台可以原生集成 Copilot 的代码补全和对话能力，无需用户切换上下文。该 SDK 面向企业级场景，支持自定义工作流和扩展。

AI产品 GitHub Copilot SDK 编程助手 API 开发工具

推荐理由：做开发工具或平台集成的团队可以直接用 Copilot SDK 把 AI 编程能力嵌入自家产品，省去自研成本，值得关注。

原文

09:52

berryxia@berryxia

精选

微软AI今日发布了七个全新MAI模型，包括MAI-Thinking-1、MAI-Code-1-Flash、MAI-Image-2.5等，覆盖推理、编码、图像、语音和转录任务。这些模型是从零开始、使用干净数据训练，不依赖蒸馏，强调血统纯净。其中MAI-Code-1-Flash在SWE-Bench Verified上达到71.6分，超越Claude Haiku 4.5，且节省60% token。MAI-Image-2.5在图像编辑和文本生图排名靠前，已集成到PowerPoint和OneDrive。微软的策略是构建专精任务、可协作的模型家族，而非追求单一通用大模型。

AI模型微软 MAI模型编程助手推理模型图像生成

推荐理由：微软这次反主流而行，用干净数据从零训练专精模型，做AI开发或选型的人值得关注——MAI-Code-1-Flash在编码任务上性价比突出，Copilot用户可以直接体验。

原文

07:58

GitHub@github

GitHub 宣布为 Copilot 引入云端和本地沙箱功能，旨在为日益增多的 Agent 工作流提供更强的代码安全、隔离和控制保障。企业团队可以通过这些沙箱安全地实验 Agent 工作流，并集中管理安全策略。此举回应了 AI 编程助手在自动化任务中可能带来的安全风险，让开发者能在受控环境中放心使用 Agent。该功能尤其适合需要严格合规的企业开发团队。

AI产品 GitHub Copilot Agent 工作流沙箱企业安全编程助手

推荐理由：GitHub 终于给 Copilot 的 Agent 模式上了安全锁，做企业级开发的团队可以直接用沙箱隔离实验，不用再担心 Agent 乱改代码。

原文

01:31

berryxia@berryxia

88°

OpenAI 发布了 Codex Python SDK，通过一行 pip install openai-codex 即可安装。该 SDK 允许开发者在 Python 代码中直接启动线程、运行 turn、实时流式传输进度、恢复会话、传递图片，并精细控制沙盒访问权限。它复用现有 Codex 认证，无需额外账号，底层通过本地 app-server 与脚本通信，解决了每次输入都新建 node 进程的内存和状态管理问题。这标志着 Codex 从浏览器中的 AI IDE 转变为可编程基础设施，开发者可将其作为 agent harness 集成到脚本、调度器或仪表盘中，实现断点续跑和状态保留，重构了从“切出去问 AI”到“让 AI 在代码中执行”的工作流。

AI产品 Codex Python SDK 编程助手智能体开源/仓库

推荐理由：Codex SDK 把 AI 编程从手动 Vibe Coding 升级为可编程基础设施，做 agent pipeline 的开发者终于不用手写胶水代码了——线程管理、状态持久、沙盒隔离全打包好，直接 pip 安装就能用。

原文

01:23

向阳乔木@vista8

83°

OpenAI 的 Codex 发布了 Python SDK，开发者可通过 pip install openai-codex 安装，并将其直接集成到自己的 Python 应用和工作流中。该 SDK 支持启动线程、运行对话、流式进度、恢复会话、传递图片以及控制沙盒访问等核心功能，同时可复用 Codex 的登录态。这意味着开发者无需从零构建，就能在自己的代码中内置一个顶级的编程与图像生成 Agent。此举大幅降低了将 AI 能力嵌入现有系统的门槛，尤其适合需要自动化编程或图像处理的团队。

AI产品 Codex Python SDK 编程助手生图 Agent 自动化工作流

推荐理由：Codex Python SDK 让开发者能直接在自己的应用里嵌入顶级编程和生图 Agent，省去从头搭建的麻烦。做自动化工作流或 AI 工具的团队，建议立即试试 pip install openai-codex。

原文

6月2日

22:55

阶跃星辰 Stepfun@Stepfun_AI

Step 3.7 Flash 是一款面向快速智能体编码的开源权重模型，支持可靠工具调用和多模态理解。该模型已从模型卡片阶段进入实际编码工作流，由 @kilocode 团队在博客中详细介绍。其设计重点在于提升智能体编码效率，适合开发者集成到自动化编程任务中。这一进展标志着开源模型在实用化方面迈出重要一步。

AI模型开源/仓库推理模型编程助手智能体 MCP/工具

推荐理由：做智能体编码的开发者终于有了一个可直接使用的开源模型——Step 3.7 Flash 的可靠工具调用和多模态能力能显著提升自动化效率，建议点开博客了解具体集成方式。

原文

10:57

shao__meng@shao__meng

一位开发者分享了 Cursor $10K Credits 到期后的使用体验，5月消耗约 $2K。他100%时间使用 Agent Window，传统 IDE 界面从未打开；多模型切换使用较少，主要用 GPT-5.5 和 Composer 2.5，后者 Fast 模式速度快且喜欢输出流程图。Context 使用明细方便，但 Agent 输出默认非 Markdown 且不支持拷贝，需指定输出到 Markdown 文件。Agent 界面右侧扩展窗口（Terminal、Browser、File、Canvas）实用。他还提到收到 Cursor 团队私信赠送 Credits 和两个月 Ultra 订阅，鼓励用户多尝试新功能并反馈。

AI产品 Cursor Agent Window 编程助手 AI编程使用体验

推荐理由：Cursor 重度用户分享 $10K Credits 自由使用的真实体验，做 AI 编程的开发者能从中了解 Agent Window 的实用技巧和痛点，值得参考。

原文

10:22

宝玉@dotey

精选

Cursor 宣布为所有 Teams 用户增加使用额度，并推出 Premium 团队席位，提供 5 倍额度仅需 3 倍成本。博主重度使用 Cursor Agent 后给出好评，认为其 multitask 模式可并行多个后台任务，速度不错；支持灵活选择多种模型，不像 Codex 和 Claude Code 受限；Plan 模式详细且稳定。不足之处包括不支持 /goal 命令、无手机版，以及缺少类似 Codex 的 Chrome use + Computer use 调试功能。整体评价在常用 GUI Agent 中排名第二，仅次于 Codex App。

AI产品 Cursor Agent GUI Agent 编程助手额度升级

推荐理由：Cursor 的 Agent 模式在并行任务和模型灵活性上表现突出，做自动化开发的团队可以关注这次额度升级，性价比不错。

原文

10:08

elvis@omarsar0

ClaudeDevs 宣布已为所有 Pro 和 Max 计划用户重置了 5 小时和周速率限制。此前，一个导致某些 Claude Code 会话生成过多并行子智能体的 bug 被修复，该问题曾导致用户使用量消耗过快。此次修复和重置将帮助用户更稳定地使用服务，避免意外超限。

AI产品 Claude Code 速率限制子智能体 bug修复编程助手

推荐理由：Claude Code 的重度用户终于不用再担心速率限制被意外烧光——修复了并行子智能体 bug 后，Pro/Max 用户的配额已重置，做自动化编程的团队可以直接恢复高强度使用。

原文

10:04

宝玉@dotey

OpenAI 宣布将于明天（6月2日）举行直播，预览 Codex 和 OpenAI 平台的重要更新。直播时间为太平洋时间上午8:30 / 东部时间上午11:30 / 英国夏令时下午4:30。Derrick Choi 在推文中邀请用户参与，并附有直播链接。这一更新可能涉及 Codex 编程助手的新功能或平台改进，对开发者社区有重要影响。

AI产品 Codex OpenAI platform 直播更新编程助手开发者

推荐理由：OpenAI 的 Codex 更新可能带来编程效率的飞跃，做 AI 开发或使用 OpenAI API 的团队值得关注直播，抢先了解新功能。

原文

09:56

歸藏(guizang.ai)@op7418

精选

CodePilot 发布了 0.55.0-preview.5 重构版本，UI 整体重做，并新增支持将 Codex 作为 Agent 引擎。用户既可以使用 Codex 内置模型，也可以自定义模型。目前为测试版本，未自动推送，可能存在较大 bug，欢迎用户反馈日志。

AI产品编程助手 CodePilot Codex Agent引擎 UI重构

推荐理由：CodePilot 这次重构把 UI 和 Agent 引擎一起升级了，做 AI 编程的开发者可以直接体验 Codex 作为 Agent 的效果，值得点开看看。

原文

00:17

Paul Couvert@itsPaulAi

83°

MiniMax 发布开源权重模型 M3，在 SWE-Bench Pro 上达到 59.0%，与 GPT-5.5 持平，并在多项编码基准上与 Opus 4.7 不相上下。M3 还支持 1M 上下文、原生多模态，使用成本仅为 GPT 和 Opus 的十分之一。权重和技术报告将在约 10 天后在 Hugging Face 开放。这标志着开源模型首次在多个前沿能力上追平闭源顶级模型，对 AI 开发者和企业用户意义重大。

AI模型开源/仓库推理模型编程助手 MiniMax M3

推荐理由：开源模型首次在编码和智能体任务上追平 GPT-5.5 和 Opus，成本却低一个数量级。做 AI 应用开发或自建模型的团队，值得关注权重发布后直接试用。

原文

6月1日

11:44

ollama@ollama

精选76°

MiniMax 与 Ollama 合作，将 M3 模型部署在 Ollama Cloud 上，面向美国用户且零数据留存。M3 是首个结合编程、智能体与多模态能力的开源权重模型，在 SWE-Bench Pro 上达到 59.0%，Terminal Bench 2.1 为 66.0%，并支持 100 万 token 上下文。用户可通过 Claude Code、Codex 或直接聊天方式在 Ollama 上使用 M3。模型权重和技术报告将在约 10 天后发布。

AI模型 MiniMax M3 Ollama 编程助手智能体

推荐理由：M3 在编程和智能体任务上表现突出，做自动化开发或智能体应用的团队可以直接在 Ollama Cloud 上免费试，零数据留存也适合对隐私敏感的开发者。

原文

11:25

elvis@omarsar0

MiniMax 即将发布其新一代模型 M3，目前已在 OpenCode 平台上开放免费试用。AI 研究员 Omar 表示将使用自己的编码代理和测试框架对 M3 进行深度测试，并计划发布评测。这一消息引发了社区关注，已有近 3000 次浏览。M3 的发布可能为编程助手和智能体领域带来新的选择。

AI模型 MiniMax M3 编程助手智能体开源/仓库

推荐理由：MiniMax M3 即将上线，做 AI 编程和智能体开发的团队可以趁免费期在 OpenCode 上抢先体验，看看它能否成为你工作流中的新利器。

原文

11:24

宝玉@dotey

dotey 在 X 上分享了 Claude Code 中 /goal 命令的两种高效用法：一是将逆向代码的完整任务整理成 JSON 文件，让 AI 分批处理并逐条勾选 Checklist；二是与 AI 协作编写详细设计文档，划分多个 Phase 并设定验收条件，每个 Phase 执行后自动 commit。这些实践展示了 /goal 如何将复杂任务拆解为可追踪的步骤，提升 AI 编程的可靠性和效率。

技巧 Claude Code /goal 最佳实践编程助手任务拆解

推荐理由：做复杂代码逆向或大型设计文档的开发者，用 /goal 把任务拆成可追踪的步骤，能显著减少遗漏和返工，建议直接复制这两个模式试试。

原文

11:11

OpenRouter@OpenRouterAI

精选76°

MiniMax-M3 是一款前沿开源权重模型，已在 OpenRouter 平台上线。它集成了 100 万 token 的超长上下文窗口、顶尖的编程与智能体能力，以及原生支持图像和视频的多模态处理。该模型在编码和智能体任务上表现卓越，同时保持了开源特性，为开发者和研究者提供了强大的工具。其 1M token 上下文窗口尤其适合处理长文档、复杂代码库和多模态数据融合场景。

AI模型 MiniMax-M3 开源模型长上下文多模态编程助手

推荐理由：MiniMax-M3 把长上下文、强编码和多模态塞进一个开源模型里，做复杂智能体或长文档处理的团队可以直接在 OpenRouter 上试，省去自己部署的麻烦。

原文

09:37

elvis@omarsar0

精选

一位用户在 X 上分享使用 DeepSeek-v4-flash 的体验，称已花费数亿 token（约 10 美元），效果令人印象深刻。他将其用于自建编程智能体的自我改进，认为表现非常出色。该模型以极低的价格提供了高质量的性能，尤其适合需要大量 token 的开发者。更多细节将在后续分享。

AI模型 DeepSeek-v4-flash 编程助手智能体性价比开源/仓库

推荐理由：DeepSeek-v4-flash 以极低成本（百万 token 约 10 美元）实现高质量代码生成，做智能体或编程工具的开发者值得一试，性价比远超同类模型。

原文

09:24

Clement Delangue@ClementDelangue

Hugging Face CEO Clement Delangue 在 X 上呼吁更多人公开分享编程和智能体追踪数据，以构建更好的数据集和开源模型。他指出已有不少人贡献，鼓励大家也分享自己的数据。同时，Simon Willison 抱怨 OpenAI 的 Codex Desktop 在更新中移除了“Copy as Markdown”功能，该功能曾是他最喜欢的导出完整聊天记录的方式。这一变化引发了对数据共享和工具可用性的讨论。公开分享追踪数据有助于推动开源模型进步，但工具功能的移除可能影响开发者体验。

行业开源/仓库编程助手数据共享智能体 OpenAI Codex

推荐理由：如果你在训练或使用开源编程模型，公开分享追踪数据能直接提升数据集质量，Hugging Face 的号召值得响应。做 AI 编程工具的团队也能从中获得更丰富的训练素材。

原文

5月31日

09:36

宝玉@dotey

精选

Matt Pocock 开源了 Sandcastle，一个用 TypeScript 脚本编排多个 AI Agent（如 Codex、Claude Code、Cursor、GitHub Copilot）协同工作的工具。它允许用户定义工作流，让不同 Agent 在虚拟机中依次或并行执行任务，例如让多个 Agent 分别生成技术方案并相互评分。该工具适合追求极致自动化的极客场景，但对普通用户门槛较高。

AI产品智能体 MCP/工具开源/仓库编程助手工作流编排

推荐理由：多 Agent 编排是提升 AI 协作效率的关键，做复杂自动化或赛博养蛊的开发者可以直接试试这个开源方案。

原文

5月30日

18:36

Philipp Schmid@_philschmid

一位开发者指出，使用编程助手（如AI编码代理）是一项需要学习的深度技能，而非简单工具。许多人因使用不当而产生糟糕结果，但这恰恰说明它需要练习和提升。该技能的上限很高，掌握后能显著提升效率。这一观点引发共鸣，提醒开发者重视AI工具的熟练运用。

技巧编程助手技能提升 AI工具开发者效率

推荐理由：AI编程助手正成为开发者必备工具，但很多人因使用不当而效果不佳。这篇文章点出关键：用好它是门技能，值得花时间练习，做AI辅助开发的团队建议看看。

原文

12:02

@OpenAIDevs@OpenAIDevs

精选

OpenAI 发布了 Codex 的更新日志，详细介绍了最新版本的变化和改进。Codex 是 OpenAI 的 AI 编程助手，能够将自然语言转换为代码。此次更新可能包括性能优化、新功能或修复，旨在提升开发者的编程效率。对于使用 Codex 的团队来说，了解这些变化有助于更好地利用工具。

AI产品编程助手 Codex OpenAI 更新日志开发者工具

推荐理由：Codex 更新日志直接关系到 AI 编程的效率提升，做自动化开发的团队值得关注，建议点开看看具体改了什么。

原文

10:44

宝玉@dotey

精选

有用户发现 GitHub Copilot 中 Gemini 3.5 Flash 的 Token 消耗按 14 倍计算，而 Claude Sonnet 4.6 为 1 倍，Claude Opus 4.8 为 15 倍，Gemini 3.1 Pro 为 1 倍，GPT-5.5 为 7.5 倍。这一差异意味着使用 Gemini 3.5 Flash 的实际成本远高于标称价格，对 Copilot 用户选择模型时的成本控制有直接影响。

AI产品 GitHub Copilot Gemini 3.5 Flash Token 消耗成本对比编程助手

推荐理由：GitHub Copilot 用户注意了——不同模型 Token 消耗倍数差异巨大，选错模型可能多花十几倍费用，做 AI 编程的团队建议收藏对比表。

原文

5月29日

21:49

shao__meng@shao__meng

Grok Build 0.1 模型现已集成到 Cursor 编辑器中，用户可以直接在 Cursor 中使用 Grok 进行代码生成和构建。这一更新为 Cursor 用户提供了新的 AI 编程助手选择，尤其适合需要快速原型开发和代码补全的开发者。目前该功能已上线，用户可立即体验。

AI产品 Grok Build Cursor 编程助手代码生成 AI 编辑器

推荐理由：Cursor 用户多了一个强大的模型选择——Grok Build 0.1 擅长代码生成，做快速原型或日常开发的可以直接切换试试。

原文

18:07

AI Will@FinanceYF5

83°

Claude Code 推出了一项名为“动态工作流”的新功能，允许用户通过设置 /model 为 opus 4.8 和 /effort 为 ultracode，并在提示词中使用“workflow”来触发。该功能会自动编写编排脚本、生成子智能体群组、验证结果并返回报告。这标志着 AI 编程工具从单步执行向多智能体协作的演进，显著提升了复杂任务的自动化程度。

AI产品 Claude Code 动态工作流智能体编程助手自动化

推荐理由：做复杂自动化任务的开发者终于可以一键启动多智能体协作——Claude Code 的编排能力直接省去手动写脚本的麻烦，值得立刻上手试。

原文

12:15

OpenRouter@OpenRouterAI

精选76°

StepFun 发布了 Step 3.7 Flash 模型，这是一款面向智能体、编码、搜索和多模态工作流的高效模型。该模型采用 198B 稀疏 MoE 架构，仅激活约 11B 参数，支持 256K 上下文和三种推理级别，推理速度达 400 TPS。在 ClawEval-1.1、SimpleVQA Search 和 SWE-PRO 等基准测试中表现领先，并支持视觉理解、工具调用和本地运行。模型权重以 Apache 2.0 开源，可在 Mac Studio、DGX Spark 等设备上运行。

AI模型智能体推理模型开源/仓库编程助手多模态

推荐理由：Step 3.7 Flash 解决了智能体场景中速度与可靠性的平衡问题，做智能体开发、编码自动化和多模态应用的团队可以直接用开源权重部署，值得一试。

原文

12:15

OpenRouter@OpenRouterAI

精选

阶跃星辰的 Step 3.7 Flash 模型已在 OpenRouter 平台上线。该模型是一个多模态（图像/视频/文本）MoE 架构，总参数量达 196B，但推理时仅激活 11B 参数，效率极高。模型针对编程、智能体工作流和结构化输出进行了专门调优，并支持可选的推理级别，用户可根据需求在速度、成本和深度之间灵活权衡。

AI模型阶跃星辰 Step 3.7 Flash MoE 多模态编程助手

推荐理由：做编程和智能体开发的团队终于有了一个高效的多模态 MoE 选择——196B 参数只激活 11B，成本可控且支持灵活推理级别，建议在 OpenRouter 上直接试。

原文

11:35

AI Will@FinanceYF5

91°

Anthropic发布了Claude Opus 4.8，在编程能力和agent能力上显著增强，支持数百个并行子agent的动态工作流，且价格保持不变。此外，据透露更高级别的Mythos模型将在数周内发布。这次更新为开发者提供了更强大的多智能体协作能力，同时保持了性价比。

AI模型 Claude Opus 4.8 Anthropic 智能体并行工作流编程助手

推荐理由：做复杂自动化工作流的开发者终于有了能并行调度数百子agent的模型，且不加价，值得立即体验。

原文

09:57

歸藏(guizang.ai)@op7418

78°

Anthropic 发布了 Claude Opus 4.8，相比 Opus 4.7 在各项能力上均有提升。最关键的改进是模型自我审查能力显著增强，能够更有效地发现自身代码中的问题，而此前版本的自审几乎无效。新模型还拥有更敏锐的判断力、更诚实的自我评估，并能更长时间独立工作。Opus 4.8 定价与上一代相同，现已可用。

AI模型 Claude Opus 4.8 推理模型编程助手自我纠错

推荐理由：对依赖 AI 编程的开发者来说，Opus 4.8 的自我纠错能力解决了代码审查的痛点——以前让模型自己 review 代码基本没用，现在可以真正信任它帮你发现 bug，建议立即升级体验。

原文

09:18

shao__meng@shao__meng

83°

Anthropic 在宣布 H 轮 650 亿美金融资当天，发布了 Claude Opus 4.8。该模型在编码、Agent 任务和知识工作方面显著提升，SWE-Bench Pro 达到 69.2%，Terminal-Bench 2.1 为 74.6%。关键改进包括更诚实的自我监控（误判减少 4 倍）、更稳定的 Agent 协作质量，以及计算机/浏览器 Agent 能力提升（OSWorld-Verified 83.4%）。同时引入 Claude Code Dynamic Workflows，支持从单 Agent 到规划、并行、验证的协作模式。定价不变，即日可用。

AI模型 Claude Opus 4.8 推理模型 Agent/智能体编程助手浏览器自动化

推荐理由：做复杂编码、Agent 和浏览器自动化的团队可以直接升级——Opus 4.8 在诚实度和任务完成率上都有实质提升，且价格不变，值得立即试用。

原文

09:18

shao__meng@shao__meng

83°

Claude Code 发布 Dynamic Workflows 功能，将 AI 编程从单个 agent 执行升级为 agent 自动担任项目经理和调度层。该功能让 Claude 根据任务现场动态生成编排脚本，在单次会话中启动数十到数百个并行 subagent，并进行独立验证和对抗性审查。标杆案例是 Bun 创始人用此功能在 11 天内完成从 Zig 到 Rust 的 75 万行代码迁移，测试通过率达 99.8%。Dynamic Workflows 解决了上下文窗口有限、单视角易漏检、长任务易中断和对话上下文污染等问题，支持数小时到数天的持续运行。这是多 agent 协作从高级用户自建走向产品化的关键一步。

AI产品 Claude Code Dynamic Workflows 多 agent 协作代码迁移编程助手

推荐理由：做大型代码迁移或复杂工程重构的开发者，终于有了能端到端自动跑完的 AI 工具——Bun 的 75 万行 Rust 迁移 11 天搞定就是证明，建议直接试试。

原文