01:28SiliconFlowAI@siliconflowai83°SiliconFlow 宣布将 OpenRouter 上排名第一的编程智能体 Hermes Agent 集成到 Discord 服务器中。用户可以通过 Discord 直接使用该智能体进行编程任务,无需额外设置。Hermes Agent 由 NousResearch 开发,在 OpenRouter 上表现优异。SiliconFlow 提供了详细的设置步骤、模型选择建议和专业技巧,帮助用户快速上手。这一集成让编程助手更易访问,适合团队协作场景。AI产品编程助手智能体Discord 集成Hermes AgentSiliconFlow推荐理由:编程团队终于可以在 Discord 里直接调用顶级智能体了——Hermes Agent 在 OpenRouter 上排名第一,做协作开发的团队建议试试这个集成,省去切换工具的麻烦。原文
00:31阶跃星辰 Stepfun@Stepfun_AIStep 3.7 Flash 模型专为真实世界的智能体编程任务设计,不仅追求代码生成速度,更注重在复杂输出中保持逻辑、视觉和执行的一致性。该模型在演示中展示了其在多步骤、多模态任务中的连贯性,适合需要高可靠性的编程场景。开发者 @atomic_chat_hq 的创意测试进一步验证了其能力。AI模型智能体编程助手推理模型Step 3.7 Flash多模态推荐理由:做智能体编程的开发者终于有了一个兼顾速度和一致性的模型——Step 3.7 Flash 在复杂任务中保持逻辑连贯,值得在真实项目中试试。原文
23:42OpenRouter@OpenRouterAIOpenRouter 的 Pareto Router 目前每天处理近 10 亿 tokens,而 Auto Router 处理 120 亿 tokens。Pareto Router 专为编程场景设计,用户只需设定智能水平和成本上限,系统会自动选择最佳模型。这为 AI 编程用户提供了一种高效节省成本的方式,同时 Workspaces 功能支持设置最大使用量。该工具被评价为最被低估的 AI 编程成本节省方案。AI产品OpenRouterPareto Router编程助手成本优化模型路由推荐理由:AI 编程用户想省成本又不想牺牲效果,Pareto Router 直接帮你选最优模型,比手动调模型省心太多,建议试试。原文
23:11向阳乔木@vista8如果你在多台电脑上安装了 Codex 并登录同一个 ChatGPT 账号,可以在设置中通过“连接 - 控制其他设备”添加其他电脑。设置后,本机创建项目时可以选择添加远程项目,从而远程控制家中电脑的 Codex 工作。这个功能让多设备协作更灵活,适合需要在不同地点使用 Codex 的开发者。技巧Codex远程控制多设备协作编程助手小技巧推荐理由:多设备用户终于不用来回切换了——远程控制另一台电脑的 Codex 写代码,省去物理移动的麻烦,有多个工作站的开发者可以直接试试这个隐藏功能。原文
21:03Simon Willison@simonw据报道,Uber 对每位员工使用的每款编程助手工具设定了每月 1500 美元的费用上限。这一举措反映了企业对 AI 编程工具成本控制的重视,同时也暗示了 Uber 认为这些工具能带来的实际价值。该消息由开发者 Simon Willison 在 X 平台分享,引发了关于企业如何平衡 AI 工具投入与回报的讨论。对于其他公司而言,这可能是一个参考案例,表明在推广 AI 编程助手时,需要建立合理的预算和评估机制。行业编程助手成本控制Uber企业实践AI 工具推荐理由:Uber 的定价上限给所有引入 AI 编程助手的团队提了个醒——工具虽好,但成本控制不能少。做技术选型和预算管理的开发者值得关注这个真实案例。原文
16:04Ate-a-Pi@svpino精选开发者 Santiago 分享了一个 Claude Code 的使用技巧:当上下文利用率超过 60% 时,模型性能会下降,且自动压缩可能丢失重要信息。他建议通过 /statusline 命令实时监控上下文百分比,并在超过阈值时手动运行 /compact 命令,附带提示词指定保留内容(如项目描述和变更指令)。这样能更精准地控制上下文压缩,避免关键信息丢失。技巧Claude Code上下文管理压缩技巧效率提升编程助手推荐理由:Claude Code 重度用户经常遇到上下文溢出导致模型变笨的问题,这个 60% 规则和手动压缩技巧能帮你精准控制保留内容,避免自动压缩丢失关键信息,建议试试。原文
14:15AI Will@FinanceYF588°Anthropic 正在使用 1000 名自由软件工程师来训练其编程助手 Claude Code。每位工程师每完成一个任务可获得 280 美元,任务包括编写提示词、比较代码、测试后续交互,以及向 Claude 展示真实开发者的工作方式。这一做法旨在提升 Claude Code 的代码生成质量和开发流程理解能力。消息引发讨论,有人担忧 AI 训练正在“烹饪”人类自身,即人类在帮助 AI 取代自己的岗位。AI产品Claude Code编程助手AnthropicAI训练自由工程师10 个信源在谈推荐理由:Anthropic 用真实开发者训练 Claude Code,揭示了 AI 编程助手背后的数据来源和成本结构,做 AI 训练或关注编程工具演进的开发者值得了解——这直接关系到未来谁在写代码。原文
14:12AI Will@FinanceYF572°Anthropic 正在大规模招募 1000 名自由职业软件工程师,专门用于训练其编程助手 Claude Code。每完成一个任务可获得 280 美元报酬,工程师们需要编写提示词、比对代码输出、测试模型的追问响应,并教会 Claude 真实开发者的工作方式。这一举措旨在提升 Claude Code 在真实编程场景中的表现,但也引发了关于 AI 可能取代部分编程工作的讨论。对于开发者而言,这既是参与前沿 AI 训练的机会,也反映了行业对高质量训练数据的需求。AI产品AnthropicClaude Code编程助手自由职业AI训练10 个信源在谈推荐理由:Anthropic 用真金白银请工程师教 Claude 写代码,做 AI 训练或编程工具的团队值得关注——这揭示了高质量训练数据的新模式,也暗示了未来编程工作的形态变化。原文
13:48Mustafa Suleyman@mustafasuleyman88°微软CEO Mustafa Suleyman宣布推出7款全新MAI系列模型,包括文本基础模型MAI-Thinking-1、图像模型MAI-Image-2.5及高效编程模型MAI-Code-1-Flash。MAI-Thinking-1拥有350亿激活参数的MoE架构,256K上下文窗口,在AIME 2025上达到97%,SWE Bench Pro上53%,与Opus 4.6持平,且盲测中整体质量优于Sonnet 4.6。该模型针对微软自研MAIA 200芯片优化,性能每美元提升30%,每瓦性能提升1.4倍。MAI-Code-1-Flash仅5B参数,SWE Bench Pro达51%,成本更低。微软还推出Frontier Tuning服务,允许企业定制专属模型,早期案例中为McKinsey定制模型以10倍低成本超越GPT-5.5。AI模型MAI-Thinking-1MAI-Code-1-FlashMAI-Image-2.5推理模型编程助手5 个信源在谈推荐理由:微软一口气推出7款新模型,覆盖推理、编程、图像三大方向,MAI-Thinking-1在推理和编码上直接对标Claude Sonnet 4.6和Opus 4.6,做AI应用或企业定制化模型的团队值得关注——尤其是Frontier Tuning让企业用更低成本获得超越GPT-5.5的效果。原文
11:52Cognition@cognition_labs88°Cognition 发布了 Devin Desktop,一个统一的桌面界面,允许用户从单一界面管理本地和云端的智能体集群。用户可以在不离开编辑器的情况下完成规划、委托、审查和发布等操作。这标志着 AI 编程助手从单一工具向多智能体协作平台的演进,提升了开发者的工作效率。AI产品智能体编程助手Devin桌面应用多智能体管理推荐理由:Devin Desktop 解决了多智能体管理分散的痛点,做复杂开发流程的团队可以直接用,建议点开看看如何统一调度。原文
10:49GitHub@github精选76°GitHub 宣布 Copilot SDK 现已正式可用,提供稳定 API 和生产级支持。开发者可将 Copilot 的智能引擎嵌入自己的应用、服务和开发工具中。这意味着第三方工具和平台可以原生集成 Copilot 的代码补全和对话能力,无需用户切换上下文。该 SDK 面向企业级场景,支持自定义工作流和扩展。AI产品GitHub CopilotSDK编程助手API开发工具推荐理由:做开发工具或平台集成的团队可以直接用 Copilot SDK 把 AI 编程能力嵌入自家产品,省去自研成本,值得关注。原文
09:52berryxia@berryxia精选微软AI今日发布了七个全新MAI模型,包括MAI-Thinking-1、MAI-Code-1-Flash、MAI-Image-2.5等,覆盖推理、编码、图像、语音和转录任务。这些模型是从零开始、使用干净数据训练,不依赖蒸馏,强调血统纯净。其中MAI-Code-1-Flash在SWE-Bench Verified上达到71.6分,超越Claude Haiku 4.5,且节省60% token。MAI-Image-2.5在图像编辑和文本生图排名靠前,已集成到PowerPoint和OneDrive。微软的策略是构建专精任务、可协作的模型家族,而非追求单一通用大模型。AI模型微软MAI模型编程助手推理模型图像生成5 个信源在谈推荐理由:微软这次反主流而行,用干净数据从零训练专精模型,做AI开发或选型的人值得关注——MAI-Code-1-Flash在编码任务上性价比突出,Copilot用户可以直接体验。原文
07:58GitHub@githubGitHub 宣布为 Copilot 引入云端和本地沙箱功能,旨在为日益增多的 Agent 工作流提供更强的代码安全、隔离和控制保障。企业团队可以通过这些沙箱安全地实验 Agent 工作流,并集中管理安全策略。此举回应了 AI 编程助手在自动化任务中可能带来的安全风险,让开发者能在受控环境中放心使用 Agent。该功能尤其适合需要严格合规的企业开发团队。AI产品GitHub CopilotAgent 工作流沙箱企业安全编程助手推荐理由:GitHub 终于给 Copilot 的 Agent 模式上了安全锁,做企业级开发的团队可以直接用沙箱隔离实验,不用再担心 Agent 乱改代码。原文
01:31berryxia@berryxia88°OpenAI 发布了 Codex Python SDK,通过一行 pip install openai-codex 即可安装。该 SDK 允许开发者在 Python 代码中直接启动线程、运行 turn、实时流式传输进度、恢复会话、传递图片,并精细控制沙盒访问权限。它复用现有 Codex 认证,无需额外账号,底层通过本地 app-server 与脚本通信,解决了每次输入都新建 node 进程的内存和状态管理问题。这标志着 Codex 从浏览器中的 AI IDE 转变为可编程基础设施,开发者可将其作为 agent harness 集成到脚本、调度器或仪表盘中,实现断点续跑和状态保留,重构了从“切出去问 AI”到“让 AI 在代码中执行”的工作流。AI产品CodexPython SDK编程助手智能体开源/仓库10 个信源在谈推荐理由:Codex SDK 把 AI 编程从手动 Vibe Coding 升级为可编程基础设施,做 agent pipeline 的开发者终于不用手写胶水代码了——线程管理、状态持久、沙盒隔离全打包好,直接 pip 安装就能用。原文
01:23向阳乔木@vista883°OpenAI 的 Codex 发布了 Python SDK,开发者可通过 pip install openai-codex 安装,并将其直接集成到自己的 Python 应用和工作流中。该 SDK 支持启动线程、运行对话、流式进度、恢复会话、传递图片以及控制沙盒访问等核心功能,同时可复用 Codex 的登录态。这意味着开发者无需从零构建,就能在自己的代码中内置一个顶级的编程与图像生成 Agent。此举大幅降低了将 AI 能力嵌入现有系统的门槛,尤其适合需要自动化编程或图像处理的团队。AI产品CodexPython SDK编程助手生图 Agent自动化工作流10 个信源在谈推荐理由:Codex Python SDK 让开发者能直接在自己的应用里嵌入顶级编程和生图 Agent,省去从头搭建的麻烦。做自动化工作流或 AI 工具的团队,建议立即试试 pip install openai-codex。原文
22:55阶跃星辰 Stepfun@Stepfun_AIStep 3.7 Flash 是一款面向快速智能体编码的开源权重模型,支持可靠工具调用和多模态理解。该模型已从模型卡片阶段进入实际编码工作流,由 @kilocode 团队在博客中详细介绍。其设计重点在于提升智能体编码效率,适合开发者集成到自动化编程任务中。这一进展标志着开源模型在实用化方面迈出重要一步。AI模型开源/仓库推理模型编程助手智能体MCP/工具推荐理由:做智能体编码的开发者终于有了一个可直接使用的开源模型——Step 3.7 Flash 的可靠工具调用和多模态能力能显著提升自动化效率,建议点开博客了解具体集成方式。原文
10:57shao__meng@shao__meng一位开发者分享了 Cursor $10K Credits 到期后的使用体验,5月消耗约 $2K。他100%时间使用 Agent Window,传统 IDE 界面从未打开;多模型切换使用较少,主要用 GPT-5.5 和 Composer 2.5,后者 Fast 模式速度快且喜欢输出流程图。Context 使用明细方便,但 Agent 输出默认非 Markdown 且不支持拷贝,需指定输出到 Markdown 文件。Agent 界面右侧扩展窗口(Terminal、Browser、File、Canvas)实用。他还提到收到 Cursor 团队私信赠送 Credits 和两个月 Ultra 订阅,鼓励用户多尝试新功能并反馈。AI产品CursorAgent Window编程助手AI编程使用体验2 个信源在谈推荐理由:Cursor 重度用户分享 $10K Credits 自由使用的真实体验,做 AI 编程的开发者能从中了解 Agent Window 的实用技巧和痛点,值得参考。原文
10:22宝玉@dotey精选Cursor 宣布为所有 Teams 用户增加使用额度,并推出 Premium 团队席位,提供 5 倍额度仅需 3 倍成本。博主重度使用 Cursor Agent 后给出好评,认为其 multitask 模式可并行多个后台任务,速度不错;支持灵活选择多种模型,不像 Codex 和 Claude Code 受限;Plan 模式详细且稳定。不足之处包括不支持 /goal 命令、无手机版,以及缺少类似 Codex 的 Chrome use + Computer use 调试功能。整体评价在常用 GUI Agent 中排名第二,仅次于 Codex App。AI产品CursorAgentGUI Agent编程助手额度升级4 个信源在谈推荐理由:Cursor 的 Agent 模式在并行任务和模型灵活性上表现突出,做自动化开发的团队可以关注这次额度升级,性价比不错。原文
10:08elvis@omarsar0ClaudeDevs 宣布已为所有 Pro 和 Max 计划用户重置了 5 小时和周速率限制。此前,一个导致某些 Claude Code 会话生成过多并行子智能体的 bug 被修复,该问题曾导致用户使用量消耗过快。此次修复和重置将帮助用户更稳定地使用服务,避免意外超限。AI产品Claude Code速率限制子智能体bug修复编程助手推荐理由:Claude Code 的重度用户终于不用再担心速率限制被意外烧光——修复了并行子智能体 bug 后,Pro/Max 用户的配额已重置,做自动化编程的团队可以直接恢复高强度使用。原文
10:04宝玉@doteyOpenAI 宣布将于明天(6月2日)举行直播,预览 Codex 和 OpenAI 平台的重要更新。直播时间为太平洋时间上午8:30 / 东部时间上午11:30 / 英国夏令时下午4:30。Derrick Choi 在推文中邀请用户参与,并附有直播链接。这一更新可能涉及 Codex 编程助手的新功能或平台改进,对开发者社区有重要影响。AI产品CodexOpenAI platform直播更新编程助手开发者10 个信源在谈推荐理由:OpenAI 的 Codex 更新可能带来编程效率的飞跃,做 AI 开发或使用 OpenAI API 的团队值得关注直播,抢先了解新功能。原文
09:56歸藏(guizang.ai)@op7418精选CodePilot 发布了 0.55.0-preview.5 重构版本,UI 整体重做,并新增支持将 Codex 作为 Agent 引擎。用户既可以使用 Codex 内置模型,也可以自定义模型。目前为测试版本,未自动推送,可能存在较大 bug,欢迎用户反馈日志。AI产品编程助手CodePilotCodexAgent引擎UI重构推荐理由:CodePilot 这次重构把 UI 和 Agent 引擎一起升级了,做 AI 编程的开发者可以直接体验 Codex 作为 Agent 的效果,值得点开看看。原文
00:17Paul Couvert@itsPaulAi83°MiniMax 发布开源权重模型 M3,在 SWE-Bench Pro 上达到 59.0%,与 GPT-5.5 持平,并在多项编码基准上与 Opus 4.7 不相上下。M3 还支持 1M 上下文、原生多模态,使用成本仅为 GPT 和 Opus 的十分之一。权重和技术报告将在约 10 天后在 Hugging Face 开放。这标志着开源模型首次在多个前沿能力上追平闭源顶级模型,对 AI 开发者和企业用户意义重大。AI模型开源/仓库推理模型编程助手MiniMaxM3推荐理由:开源模型首次在编码和智能体任务上追平 GPT-5.5 和 Opus,成本却低一个数量级。做 AI 应用开发或自建模型的团队,值得关注权重发布后直接试用。原文
11:44ollama@ollama精选76°MiniMax 与 Ollama 合作,将 M3 模型部署在 Ollama Cloud 上,面向美国用户且零数据留存。M3 是首个结合编程、智能体与多模态能力的开源权重模型,在 SWE-Bench Pro 上达到 59.0%,Terminal Bench 2.1 为 66.0%,并支持 100 万 token 上下文。用户可通过 Claude Code、Codex 或直接聊天方式在 Ollama 上使用 M3。模型权重和技术报告将在约 10 天后发布。AI模型MiniMaxM3Ollama编程助手智能体推荐理由:M3 在编程和智能体任务上表现突出,做自动化开发或智能体应用的团队可以直接在 Ollama Cloud 上免费试,零数据留存也适合对隐私敏感的开发者。原文
11:25elvis@omarsar0MiniMax 即将发布其新一代模型 M3,目前已在 OpenCode 平台上开放免费试用。AI 研究员 Omar 表示将使用自己的编码代理和测试框架对 M3 进行深度测试,并计划发布评测。这一消息引发了社区关注,已有近 3000 次浏览。M3 的发布可能为编程助手和智能体领域带来新的选择。AI模型MiniMaxM3编程助手智能体开源/仓库推荐理由:MiniMax M3 即将上线,做 AI 编程和智能体开发的团队可以趁免费期在 OpenCode 上抢先体验,看看它能否成为你工作流中的新利器。原文
11:24宝玉@doteydotey 在 X 上分享了 Claude Code 中 /goal 命令的两种高效用法:一是将逆向代码的完整任务整理成 JSON 文件,让 AI 分批处理并逐条勾选 Checklist;二是与 AI 协作编写详细设计文档,划分多个 Phase 并设定验收条件,每个 Phase 执行后自动 commit。这些实践展示了 /goal 如何将复杂任务拆解为可追踪的步骤,提升 AI 编程的可靠性和效率。技巧Claude Code/goal最佳实践编程助手任务拆解推荐理由:做复杂代码逆向或大型设计文档的开发者,用 /goal 把任务拆成可追踪的步骤,能显著减少遗漏和返工,建议直接复制这两个模式试试。原文
11:11OpenRouter@OpenRouterAI精选76°MiniMax-M3 是一款前沿开源权重模型,已在 OpenRouter 平台上线。它集成了 100 万 token 的超长上下文窗口、顶尖的编程与智能体能力,以及原生支持图像和视频的多模态处理。该模型在编码和智能体任务上表现卓越,同时保持了开源特性,为开发者和研究者提供了强大的工具。其 1M token 上下文窗口尤其适合处理长文档、复杂代码库和多模态数据融合场景。AI模型MiniMax-M3开源模型长上下文多模态编程助手6 个信源在谈推荐理由:MiniMax-M3 把长上下文、强编码和多模态塞进一个开源模型里,做复杂智能体或长文档处理的团队可以直接在 OpenRouter 上试,省去自己部署的麻烦。原文
09:37elvis@omarsar0精选一位用户在 X 上分享使用 DeepSeek-v4-flash 的体验,称已花费数亿 token(约 10 美元),效果令人印象深刻。他将其用于自建编程智能体的自我改进,认为表现非常出色。该模型以极低的价格提供了高质量的性能,尤其适合需要大量 token 的开发者。更多细节将在后续分享。AI模型DeepSeek-v4-flash编程助手智能体性价比开源/仓库1 个信源在谈推荐理由:DeepSeek-v4-flash 以极低成本(百万 token 约 10 美元)实现高质量代码生成,做智能体或编程工具的开发者值得一试,性价比远超同类模型。原文
09:24Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue 在 X 上呼吁更多人公开分享编程和智能体追踪数据,以构建更好的数据集和开源模型。他指出已有不少人贡献,鼓励大家也分享自己的数据。同时,Simon Willison 抱怨 OpenAI 的 Codex Desktop 在更新中移除了“Copy as Markdown”功能,该功能曾是他最喜欢的导出完整聊天记录的方式。这一变化引发了对数据共享和工具可用性的讨论。公开分享追踪数据有助于推动开源模型进步,但工具功能的移除可能影响开发者体验。行业开源/仓库编程助手数据共享智能体OpenAI Codex10 个信源在谈推荐理由:如果你在训练或使用开源编程模型,公开分享追踪数据能直接提升数据集质量,Hugging Face 的号召值得响应。做 AI 编程工具的团队也能从中获得更丰富的训练素材。原文
09:36宝玉@dotey精选Matt Pocock 开源了 Sandcastle,一个用 TypeScript 脚本编排多个 AI Agent(如 Codex、Claude Code、Cursor、GitHub Copilot)协同工作的工具。它允许用户定义工作流,让不同 Agent 在虚拟机中依次或并行执行任务,例如让多个 Agent 分别生成技术方案并相互评分。该工具适合追求极致自动化的极客场景,但对普通用户门槛较高。AI产品智能体MCP/工具开源/仓库编程助手工作流编排6 个信源在谈推荐理由:多 Agent 编排是提升 AI 协作效率的关键,做复杂自动化或赛博养蛊的开发者可以直接试试这个开源方案。原文
18:36Philipp Schmid@_philschmid一位开发者指出,使用编程助手(如AI编码代理)是一项需要学习的深度技能,而非简单工具。许多人因使用不当而产生糟糕结果,但这恰恰说明它需要练习和提升。该技能的上限很高,掌握后能显著提升效率。这一观点引发共鸣,提醒开发者重视AI工具的熟练运用。技巧编程助手技能提升AI工具开发者效率推荐理由:AI编程助手正成为开发者必备工具,但很多人因使用不当而效果不佳。这篇文章点出关键:用好它是门技能,值得花时间练习,做AI辅助开发的团队建议看看。原文
12:02@OpenAIDevs@OpenAIDevs精选OpenAI 发布了 Codex 的更新日志,详细介绍了最新版本的变化和改进。Codex 是 OpenAI 的 AI 编程助手,能够将自然语言转换为代码。此次更新可能包括性能优化、新功能或修复,旨在提升开发者的编程效率。对于使用 Codex 的团队来说,了解这些变化有助于更好地利用工具。AI产品编程助手CodexOpenAI更新日志开发者工具10 个信源在谈推荐理由:Codex 更新日志直接关系到 AI 编程的效率提升,做自动化开发的团队值得关注,建议点开看看具体改了什么。原文
10:44宝玉@dotey精选有用户发现 GitHub Copilot 中 Gemini 3.5 Flash 的 Token 消耗按 14 倍计算,而 Claude Sonnet 4.6 为 1 倍,Claude Opus 4.8 为 15 倍,Gemini 3.1 Pro 为 1 倍,GPT-5.5 为 7.5 倍。这一差异意味着使用 Gemini 3.5 Flash 的实际成本远高于标称价格,对 Copilot 用户选择模型时的成本控制有直接影响。AI产品GitHub CopilotGemini 3.5 FlashToken 消耗成本对比编程助手推荐理由:GitHub Copilot 用户注意了——不同模型 Token 消耗倍数差异巨大,选错模型可能多花十几倍费用,做 AI 编程的团队建议收藏对比表。原文
21:49shao__meng@shao__mengGrok Build 0.1 模型现已集成到 Cursor 编辑器中,用户可以直接在 Cursor 中使用 Grok 进行代码生成和构建。这一更新为 Cursor 用户提供了新的 AI 编程助手选择,尤其适合需要快速原型开发和代码补全的开发者。目前该功能已上线,用户可立即体验。AI产品Grok BuildCursor编程助手代码生成AI 编辑器8 个信源在谈推荐理由:Cursor 用户多了一个强大的模型选择——Grok Build 0.1 擅长代码生成,做快速原型或日常开发的可以直接切换试试。原文
18:07AI Will@FinanceYF583°Claude Code 推出了一项名为“动态工作流”的新功能,允许用户通过设置 /model 为 opus 4.8 和 /effort 为 ultracode,并在提示词中使用“workflow”来触发。该功能会自动编写编排脚本、生成子智能体群组、验证结果并返回报告。这标志着 AI 编程工具从单步执行向多智能体协作的演进,显著提升了复杂任务的自动化程度。AI产品Claude Code动态工作流智能体编程助手自动化推荐理由:做复杂自动化任务的开发者终于可以一键启动多智能体协作——Claude Code 的编排能力直接省去手动写脚本的麻烦,值得立刻上手试。原文
12:15OpenRouter@OpenRouterAI精选76°StepFun 发布了 Step 3.7 Flash 模型,这是一款面向智能体、编码、搜索和多模态工作流的高效模型。该模型采用 198B 稀疏 MoE 架构,仅激活约 11B 参数,支持 256K 上下文和三种推理级别,推理速度达 400 TPS。在 ClawEval-1.1、SimpleVQA Search 和 SWE-PRO 等基准测试中表现领先,并支持视觉理解、工具调用和本地运行。模型权重以 Apache 2.0 开源,可在 Mac Studio、DGX Spark 等设备上运行。AI模型智能体推理模型开源/仓库编程助手多模态推荐理由:Step 3.7 Flash 解决了智能体场景中速度与可靠性的平衡问题,做智能体开发、编码自动化和多模态应用的团队可以直接用开源权重部署,值得一试。原文
12:15OpenRouter@OpenRouterAI精选阶跃星辰的 Step 3.7 Flash 模型已在 OpenRouter 平台上线。该模型是一个多模态(图像/视频/文本)MoE 架构,总参数量达 196B,但推理时仅激活 11B 参数,效率极高。模型针对编程、智能体工作流和结构化输出进行了专门调优,并支持可选的推理级别,用户可根据需求在速度、成本和深度之间灵活权衡。AI模型阶跃星辰Step 3.7 FlashMoE多模态编程助手2 个信源在谈推荐理由:做编程和智能体开发的团队终于有了一个高效的多模态 MoE 选择——196B 参数只激活 11B,成本可控且支持灵活推理级别,建议在 OpenRouter 上直接试。原文
11:35AI Will@FinanceYF591°Anthropic发布了Claude Opus 4.8,在编程能力和agent能力上显著增强,支持数百个并行子agent的动态工作流,且价格保持不变。此外,据透露更高级别的Mythos模型将在数周内发布。这次更新为开发者提供了更强大的多智能体协作能力,同时保持了性价比。AI模型Claude Opus 4.8Anthropic智能体并行工作流编程助手10 个信源在谈推荐理由:做复杂自动化工作流的开发者终于有了能并行调度数百子agent的模型,且不加价,值得立即体验。原文
09:57歸藏(guizang.ai)@op741878°Anthropic 发布了 Claude Opus 4.8,相比 Opus 4.7 在各项能力上均有提升。最关键的改进是模型自我审查能力显著增强,能够更有效地发现自身代码中的问题,而此前版本的自审几乎无效。新模型还拥有更敏锐的判断力、更诚实的自我评估,并能更长时间独立工作。Opus 4.8 定价与上一代相同,现已可用。AI模型ClaudeOpus 4.8推理模型编程助手自我纠错10 个信源在谈推荐理由:对依赖 AI 编程的开发者来说,Opus 4.8 的自我纠错能力解决了代码审查的痛点——以前让模型自己 review 代码基本没用,现在可以真正信任它帮你发现 bug,建议立即升级体验。原文
09:18shao__meng@shao__meng83°Anthropic 在宣布 H 轮 650 亿美金融资当天,发布了 Claude Opus 4.8。该模型在编码、Agent 任务和知识工作方面显著提升,SWE-Bench Pro 达到 69.2%,Terminal-Bench 2.1 为 74.6%。关键改进包括更诚实的自我监控(误判减少 4 倍)、更稳定的 Agent 协作质量,以及计算机/浏览器 Agent 能力提升(OSWorld-Verified 83.4%)。同时引入 Claude Code Dynamic Workflows,支持从单 Agent 到规划、并行、验证的协作模式。定价不变,即日可用。AI模型Claude Opus 4.8推理模型Agent/智能体编程助手浏览器自动化10 个信源在谈推荐理由:做复杂编码、Agent 和浏览器自动化的团队可以直接升级——Opus 4.8 在诚实度和任务完成率上都有实质提升,且价格不变,值得立即试用。原文
09:18shao__meng@shao__meng83°Claude Code 发布 Dynamic Workflows 功能,将 AI 编程从单个 agent 执行升级为 agent 自动担任项目经理和调度层。该功能让 Claude 根据任务现场动态生成编排脚本,在单次会话中启动数十到数百个并行 subagent,并进行独立验证和对抗性审查。标杆案例是 Bun 创始人用此功能在 11 天内完成从 Zig 到 Rust 的 75 万行代码迁移,测试通过率达 99.8%。Dynamic Workflows 解决了上下文窗口有限、单视角易漏检、长任务易中断和对话上下文污染等问题,支持数小时到数天的持续运行。这是多 agent 协作从高级用户自建走向产品化的关键一步。AI产品Claude CodeDynamic Workflows多 agent 协作代码迁移编程助手5 个信源在谈推荐理由:做大型代码迁移或复杂工程重构的开发者,终于有了能端到端自动跑完的 AI 工具——Bun 的 75 万行 Rust 迁移 11 天搞定就是证明,建议直接试试。原文