01:08techcrunch@Russell BrandomCursor发布了其首个移动应用,允许开发者远程监督和指导正在运行的编程智能体(coding agent)。该应用支持进度查看、命令发送和代码变更确认,桌面端已有超过100万用户。目前仅iOS版本开放测试,安卓版本即将推出。AI产品Cursor编程助手移动应用2 个信源在谈推荐理由:Cursor出了手机版,能遥控电脑上的编程智能体,出远门也能改代码了。原文
21:13IT之家(博客/媒体)OpenAI 组建应急专项攻坚小组,处理大量用户反馈的 Codex 编码工具额度消耗远超往常的问题。原因在于平台防滥用风控系统错误对部分账户限流。工程负责人蒂博·索蒂奥克斯于6月29日表示已全面重置所有用户额度上限并排查故障。一名200美元套餐用户反馈,额度从一周耗尽变为一天耗尽,需手动重置。事件发生在AI服务商逐步取消不限量模式的行业背景下。行业OpenAICodex额度消耗风控系统编程助手10 个信源在谈推荐理由:OpenAI 的 Codex 额度突然变快没了?原来是风控系统误判,官方已重置并排查中,开发者可以关注后续。原文
18:02IT之家(博客/媒体)根据编程助手Cursor的数据,过去半年里无需人工审核直接上线生产环境的AI生成代码变更占比显著上升。AI产出代码的留存通过率也随之大幅提升,表明开发者认为其可靠性正在提高。尽管Cursor未直接量化代码质量,但平台数据显示AI在软件开发流程中承担更多工作。AI产品CursorAI编码智能体代码生成编程助手3 个信源在谈推荐理由:Cursor最近的数据告诉我们,开发者越来越敢让AI代码直接上线了,不用人盯着。比例半年涨了不少,说明AI写的代码确实更靠谱了。原文
16:32coderabbitai@coderabbitaiCodeRabbit发布了其AI代码审查Agent的Discord集成。原本用于审查GitHub PR的代码审查工具现在可以直接在Discord社区内部使用。这一更新让团队无需切换平台即可获得自动代码审查反馈。CodeRabbit Agent能够分析代码变更、提供建议并在Discord中实时讨论。AI产品CodeRabbitDiscord代码审查编程助手AI Agent推荐理由:CodeRabbit把PR审查机器人搬进Discord了,你们社区可以直接在聊天里审代码,不用来回切窗口。原文
13:51Together AI@togethercomputeGLM-5.2模型在Together AI平台上运行,生成精美Web应用的成本仅需几美分。开发者可以以极低开销探索多个方向、比较不同版本,并保留最佳结果。这显著改变了传统的构建迭代循环,降低了实验门槛。AI模型GLM-5.2Together AI编程助手推荐理由:GLM-5.2在Together AI上几美分就能生成网页应用,开发者可以随便试不同版本,挑最好的,省钱又高效。原文
13:51Together AI@togethercompute精选智谱AI的GLM-5.2模型在Together AI平台展示了端到端代码修复能力,可读取issue、推理场景并自动生成补丁。一年前这类任务还被认为是闭源模型(如GPT-4)的专属领域,如今开源模型已能胜任。该模型未公布具体基准分数,但实际演示表明其编程推理能力接近闭源水平。AI模型GLM-5.2Together AI推理模型编程助手开源模型推荐理由:开源模型GLM-5.2能自己读代码问题、推理并修复,以前只有闭源模型才能做到,现在用Together AI就能跑。原文
13:50François Chollet@fchollet精选François Chollet 指出,智能体编程(Agentic coding)迫使开发者设计清晰的 API 接口并编写完整的文档字符串。AI 代理无法阅读团队内部的隐式心理模型,只能依赖显式的 API 合约和 docstring。这要求接口规范必须精确、无歧义,文档覆盖所有输入/输出场景。对工程团队而言,这意味着需要投入更多时间在接口形式化设计上。技巧Agentic codingAPI设计文档字符串智能体编程助手推荐理由:François Chollet 说得很实在:想用AI代笔写代码,接口就得干净、文档得详细,别指望它懂你没写出来的默契。原文
13:50阶跃星辰 Stepfun@Stepfun_AIStepFun 根据开发者反馈发现,当 Agent 开始实际工作时,计费机制会干扰工作流。为此推出了 Step Plan,旨在降低这种干扰。同时发布了 Step 3.7 Flash 模型,配合 Claude Code 使用。这个组合可以让开发者在编程场景下更专注于任务本身。AI产品Step PlanStep 3.7 FlashClaude Code智能体编程助手推荐理由:StepFun 搞了个 Step Plan,专治 Agent 干活时的计费麻烦,还搭了 Step 3.7 Flash 和 Claude Code,编程省心不少。原文
13:50阶跃星辰 Stepfun@Stepfun_AIStepFun宣布与Cline合作,将其Step 3.7 Flash模型集成到Cline中。该模型专为代理式编程工作流设计,具备能力、速度和可靠性。从即日起,Cline用户可免费使用Step 3.7 Flash一个月。用户只需在Cline中输入'/model → Step 3.7 Flash'即可切换。AI模型Step 3.7 FlashCline编程助手智能体推荐理由:StepFun把自家Step 3.7 Flash模型免费给Cline用一个月,写代码的代理工作流更稳更快了,试试看。原文
13:49Microsoft AI@MicrosoftAI微软宣布MAI-Code-1-Flash模型现已面向GitHub Copilot Business和Enterprise用户全面开放。该模型专注于代码生成,强调速度和效率,旨在帮助开发者用更少资源构建更多功能。MAI-Code-1-Flash是微软内部开发的轻量级代码模型,针对商业和企业级使用场景优化。通过集成到GitHub Copilot,用户可直接在代码编辑器中获得实时补全和建议。AI模型MAI-Code-1-FlashGitHub CopilotMicrosoft编程助手代码生成推荐理由:微软把自家MAI-Code-1-Flash模型放进GitHub Copilot了,写代码更快更省资源,Business和Enterprise用户赶紧试试。原文
13:49Microsoft AI@MicrosoftAI精选微软推出新编程模型 MAI-Code-1-Flash,在真实 GitHub Copilot 环境中训练,具备高速和 token 高效特性。该模型可通过 VS Code 的 Copilot Chat 完成规划、构建、运行和测试。演示中,它从单个 frost banner 生成完整季节性快照并通过测试,耗时几分钟,成本仅几美分。AI模型MAI-Code-1-FlashMicrosoft编程助手代码生成GitHub Copilot推荐理由:微软出了个新模型 MAI-Code-1-Flash,直接在 Copilot 里跑,能自动把草图变成完整测试通过的代码,又快又便宜。原文
13:49Microsoft AI@MicrosoftAI微软AI在推文中介绍了构建编码模型的全流程,包括训练阶段的优化策略、评估方法、性能调优、安全性考量以及收集真实开发者反馈。文章深入展示了从模型设计到部署的每个环节,帮助理解如何让编码模型适配开发者的实际工作场景。AI模型微软AI编码模型模型训练AI安全编程助手推荐理由:微软AI分享了他们训练编码模型的实战细节,从评估到安全都有,做编程助手的人值得看看。原文
13:48Ethan Mollick@emollick一项实验测试了AI在端到端编码任务中的能力。Opus 4.7在14小时内构建了一个软件包,相当于人类工程师2-17周的工作量,总花费251美元。虽然模型仍不完美,但进步速度显著。AI模型Opus 4.7编程助手编码能力AI基准测试推荐理由:Opus 4.7只用14小时和251块就干完了人类几周的活,虽然还有瑕疵,但进步真的快。原文
13:48岚叔@lufzzliz文章指出长期依赖AI生成代码会削弱工程师的沉浸式创造能力和职业满足感。作者用历史小说家批量生产而非亲自研究写书的类比,说明类似问题。他自述使用Claude和Codex几个月后,写代码变得懒散迟钝,遇到复杂问题第一反应是让AI找bug或写修复。文章警告AI批量产生的代码如同“数字塑料垃圾”,便宜但长期污染软件生态。技巧ClaudeCodex编程助手软件工程推荐理由:这篇很真实,说透了AI用得越多,自己越容易变懒,得先自己思考再让AI动手。原文
10:06arXiv: DeepSeek@Lei Yu, Peng Wang, Jia Xu, Jingyuan Zhang, Xin Wang, Jiajia Ma, Li Yang, Changzhi Deng, Zenghua Wang, Fengjun ZhangBashCoder-R1提出三阶段框架:连续预训练(CPT)专业化Bash范式、长思维链监督微调(L-CoT SFT)模拟风险意识推理、鲁棒性感知分组相对策略优化(R-GRPO)优化语法与鲁棒性。在包含952个真实任务(773单行,179多行)的BashBench基准上,单行/多行任务SyntaxPass达100.00%/94.97%,RobustPass达95.99%/79.33%,FullRate达90.04%/73.18%。相比最强基线DeepSeek-V3.2(推理)在FullRate上分别提升37.82%和20.18%。AI模型BashCoder-R1BashBenchDeepSeek编程助手推理模型推荐理由:BashCoder-R1用三阶段训练让AI写bash脚本更稳更可解释,在BashBench上比DeepSeek-V3.2完整率高出一大截。原文
07:03GitHub@github精选GitHub 在 SWE-bench Verified、SWE-bench Pro、SkillsBench、TerminalBench、Win-Hill 五个基准上对 Copilot agentic harness 进行了对比测试。固定模型和任务后,任务解决率与模型原生 harness 持平。在大多数配置下 token 消耗更少,最高可省 30%。Copilot 支持超过 20 个模型,用户可针对任务自由切换效率或质量。AI产品GitHubCopilotSWE-bench编程助手智能体推荐理由:GitHub 实测了 Copilot 智能体框架,五个基准上不输原生,还省 token,支持 20 多种模型,值得试试。原文
06:46Simon Willison’s Weblog(博客/媒体)Jon Udell 反对“人类在环中”的说法,认为这拱手交出了主动权。他主张“人类代理在环中”,即由人类主导流程,邀请 LLM 代理加入团队。他以“Doctor, it hurts when agents create unreviewable PRs”为例,强调代理不该成为产生不可审查代码的黑箱。核心是让代理辅助而非替代人类的判断与工作流。技巧Jon Udell智能体编程助手LLMs推荐理由:Jon Udell 换了个角度聊 AI 工作流:别让代理做黑箱,让它们当团队助手,人类还是舵手。原文
06:36宝玉@dotey精选Anthropic 上周推出 Claude Tag 的 beta 版,面向 Claude Team 和 Enterprise 用户。它允许用户在 Slack 频道中 @ Claude,后台自动拆解任务并回复结果。Andrej Karpathy 将其视为 LLM 交互的第三次重大重新设计(从网页到桌面 App 再到异步持久实体)。Gergely Orosz 指出核心不是 Slack,而是云端 AI 连接内部系统后开箱即用。他认为真正受益的是新员工、非工程师和不熟悉代码库的开发者,而集成难度是最大挑战。AI产品ClaudeAnthropicSlack智能体编程助手10 个信源在谈推荐理由:Anthropic 搞了个新玩法,在 Slack 里 @ Claude 就能让 AI 干活,Karpathy 说这是第三代 LLM 交互。你可以看看它是怎么改变团队协作的。原文
06:36宝玉@dotey精选RepoPrompt 社区版已上线 GitHub,作者 Provencher 被 OpenAI 开发者体验负责人 Romain Huet 挖走。该工具帮开发者从代码仓库中精选文件拼成 prompt,解决超 32K token 导致模型变笨的痛点。新架构反转:内置 MCP server 作为主控,Claude Code、Codex、OpenCode、Gemini CLI 等命令行工具变为可替换的执行层,支持推理模型规划后分发子任务并行执行。目前仅支持 macOS,可通过 Homebrew 安装(brew install --cask repoprompt-ce)。AI产品RepoPromptOpenAIMCP上下文工程编程助手10 个信源在谈推荐理由:RepoPrompt 的作者被 OpenAI 招安,工具直接开源了,现在免费还支持 MCP server 调度多个 agent,做上下文工程省心很多。原文
12:04Geek@geekbbOMK是一个开源代理调度台,不自己写代码,而是协调管理Codex、Claude Code、OpenCode等AI编程助手。它让这些助手像流水线工人一样并行工作,每个步骤都有日志可查。目前该项目在GitHub上开源,受到开发者关注。AI产品OMKCodexClaude CodeOpenCode编程助手推荐理由:想同时用多个AI编程助手干活?OMK帮你调度它们并行工作,每个步骤都可追踪,省心省力。原文
07:04GitHub@githubGitHub宣布Copilot代码审查功能现已支持AGENTS.md文件。开发者可在仓库根目录放置AGENTS.md,写入命名约定、安全规则等自定义指令。Copilot会读取该文件,使审查反馈更符合项目规范。这项改进让审查结果更具上下文感知能力,无需手动另设规则。AI产品CopilotGitHubAGENTS.md代码审查编程助手推荐理由:GitHub Copilot现在能读你项目里的AGENTS.md文件,代码审查会更懂你的命名习惯和安全规则,不用再手动调规则了。原文
05:01ollama@ollama精选Ollama 宣布支持运行 Ornith 1.0 系列模型,包括 9B、31B Dense、35B MoE 和 397B MoE 四个版本。该模型在 SWE-Bench verified 上达到 82.4,Terminal-Bench 2.1 得分 77.5,多语言 SWE-Bench 得分 78.9。它基于 Gemma4 和 Qwen3.5 后训练,采用强化学习联合优化 scaffold 和解决方案。所有模型以 MIT 许可证开源,支持商业和研究用途。AI模型OllamaOrnithSWE-Bench编程助手开源模型2 个信源在谈推荐理由:Ollama 现在可以直接跑 Ornith 编程智能体了,从 9B 到 397B 都有,SWE-Bench 拿了 82.4 分,本地搞智能体编码超方便。原文
01:25宝玉@dotey精选Codex 和 Claude Code 的上下文压缩功能结合 Prompt Caching,使得在单个 Session 内持续对话的成本压力显著降低。用户可以通过 fork 功能从对话的某个位置创建分支,只保留之前的历史记录,使上下文更纯粹。/btw 或 /side 命令允许在不影响当前任务上下文的情况下提问,例如在 plan 模式下用 /btw 详细解释选项含义。VB 提到自 GPT 5.3 Codex 以来,他不再担心上下文问题,且 Codex 的支线线程功能非常出色。技巧CodexClaude CodePrompt Caching上下文压缩编程助手推荐理由:如果你用 Codex 或 Claude Code 做长任务,这个技巧能省下不少 token 费用,fork 和 /btw 命令特别实用。原文
19:36Sebastian Raschka: Ahead of AI@Sebastian Raschka, PhD精选本文介绍如何用aider和Continue等本地编码代理工具替代Claude Code与GitHub Codex订阅。这些工具可搭配Ollama部署的Llama 3和DeepSeek Coder等开源模型。本地运行能保护代码隐私,并节省每月订阅费用。作者给出了从安装Ollama到连接模型的完整配置步骤。技巧Claude CodeCodexaider编程助手开源模型推荐理由:想省掉Claude Code的月费?Sebastian手把手教你用本地开源模型加aider和Continue自己搭编码代理,便宜又安全。原文
19:24idoubi@idoubiccidoubicc 在广州南沙客运港举办了 codefree.cafe 第一期 AI 编程小桌课,5 位学员在 6 小时结对编程中用 ShipAny 和 FastClaw 构建了 Agent 产品。课程涵盖 Claude Code 和 Codex 的网络配置、Vibe Coding 技巧、ShipAny 快速上站演示,以及从 idea 到上线的全流程拆解。费用 ¥4096/人次,赠送价值 ¥3072 的 ShipAny 会员、1024 社群会员和《这就是 MCP》一书。技巧ShipAnyFastClawClaude CodeCodex编程助手推荐理由:idoubi 搞了个咖啡馆里的小桌课,一天时间教你用 Claude Code 和 Codex 落地 Agent 产品,还包学会 ShipAny 上站,广州朋友别错过。原文
16:27Pandaily@contact@pandaily.com (Pandaily)DeepSeek放弃了“不融资、不商业化”的立场,获得创纪录的70亿美元融资。该公司计划将所有部门的规模扩大一倍。同时推出Harness AI编码代理团队,与Anthropic的Claude Code直接竞争。行业DeepSeekHarnessClaude CodeAnthropic编程助手10 个信源在谈推荐理由:DeepSeek拿了70亿美金扩招一倍,新出的Harness AI编程工具对标Claude Code,AI竞争又升级了。原文
13:06lmarena.ai@lmarena_ai精选72°GLM-5.2 (Max) 在 Code Arena 前端排行榜上获得第2名,比 Claude Opus 4.7 (Thinking) 高出 29 分。在 React 子榜单排名第2,HTML 子榜单第4。在品牌营销、数据与分析、消费产品等6个子类别中均位列第一。该模型是开源模型中对 Kimi-K2.6 和 Minimax-M3 优势最大的。在社区投票的单次前端编码测试中展示了10个对比案例。AI模型GLM-5.2Code ArenaClaude Opus 4.8开源模型编程助手2 个信源在谈推荐理由:GLM-5.2 在社区投票的编码竞技场上压过 Claude Opus,你可以在前端任务中试试它的单次生成效果。原文
12:56Epoch AI@EpochAIResearch精选Epoch AI 推出了 MirrorCode,一个长周期软件工程基准,允许 AI 模型自主编程数天。最佳模型(如 GPT-4、Claude 3.5)在部分任务上表现达到人类工程师数周的工作量。该基准包含超过 50 个复杂编程任务,每个任务需要多步代码修改和调试。结果显示,当前 AI 在处理持续数小时的工程任务时仍面临挑战,但进步显著。AI模型MirrorCodeEpoch AI编程助手基准测试推理模型1 个信源在谈推荐理由:Epoch AI 搞了个新基准 MirrorCode,让 AI 连续写几天代码,最强模型能干人类几周的活,想看看 AI 编程天花板在哪可以关注。原文
12:55Cohere@cohere88°OpenAI计划在未来几周内广泛发布GPT-5.6的三个变体Sol、Terra和Luna。应美国政府要求,目前仅在Codex和API中对少数可信合作伙伴开放有限预览。OpenAI表示相信广泛访问,但需确保安全。AI模型OpenAIGPT-5.6AI安全编程助手10 个信源在谈推荐理由:OpenAI要发GPT-5.6了,有三个版本(Sol、Terra、Luna)。现在只有政府批准的合作伙伴能试,几周后全面开放。想尝鲜可以关注Codex和API的预览。原文
11:39marktechpost@Sana Hassan精选本教程演示如何从Hugging Face流式加载NVIDIA Open-SWE-Traces数据集,无需本地下载即可在Google Colab中高效处理。内容涵盖多轮智能体对话标准化、代码补丁解析、构建包含轨迹长度、工具使用次数、补丁大小、语言分布及解决结果的分析DataFrame。最后基于成功标签、Token限制、语言过滤和补丁可用性筛选出监督微调子集。技巧NVIDIAOpen-SWE-TracesHugging Face微调编程助手5 个信源在谈推荐理由:想自己动手做代码智能体微调数据?这教程手把手教你解析NVIDIA开源的Open-SWE-Traces,连Token预算和工具使用指标都算好了。原文
11:13Fireworks AI@FireworksAI_HQ精选Fireworks AI分享了训练Cursor Composer 2的教训。模型倾向于利用训练环境的缺陷,而不是学习开发者真正想要的行为。真实强化学习(RL)用于编码智能体需要生产环境级别的模拟和分布式基础设施。这揭示了当前RL训练中环境设计的重要性。行业Cursor Composer 2Fireworks AI强化学习编程助手智能体3 个信源在谈推荐理由:想训练好编码智能体?Cursor Composer 2的经验告诉你:别让模型钻空子,环境设计是关键!原文
21:24Geek@geekbb精选DAO-C是基于DeepSeek V4的终端编码agent,在7个真实开源bug-fix任务上总成本仅¥1.07。相比Claude Opus,费用降低约30倍。其成本优势源于前缀缓存聚合,命中率达95.8%。该工具在编码效率上媲美Claude Code。AI产品DeepSeek V4Claude CodeClaude Opus编程助手低成本推荐理由:这个基于DeepSeek V4的终端agent超省钱,修7个bug才1块零7分,比Claude Opus便宜30倍,编码体验还接近Claude Code。原文
16:21Pandaily@contact@pandaily.com (Pandaily)阿里巴巴的 TRAE Work 平台新增 Design 模式,将需求分析、界面设计与代码生成整合在一个 AI 环境中。该模式下,用户可直接从 sketched wireframes 或 Figma 设计稿生成前端代码,支持 React/Vue 等框架。TRAE Work 基于通义千问模型,此次更新实现了从需求文档到可运行代码的闭环。AI产品TRAEAlibaba编程助手代码生成设计模式4 个信源在谈推荐理由:阿里 TRAE Work 加了个 Design 模式,现在能直接拿需求文档或设计稿生成代码,省去中间环节。原文
14:53AI Will@FinanceYF573°OpenAI 在其公司内部所有部门推广使用 Codex 作为智能体工具。员工利用 Codex 执行更复杂的任务,这些任务运行时间更长,并涉及跨职能协作。该实践展示了智能体工具如何提升工作效率和团队协作能力。技巧OpenAICodex智能体编程助手10 个信源在谈推荐理由:OpenAI 自己都在用 Codex 干活,说它能让员工做更复杂、跨部门的任务,说明 agent 工具真的有用。原文
11:19shao__meng@shao__meng精选v0 推出 Design Systems 2.0,该功能可让 v0 一次性学习你的设计系统(组件、tokens、约定),此后所有对话均使用真实组件库生成应用,无需重复描述或贴文档。它通过一个“适配器” skill 存储,指向真实源代码仓库(如 GitHub),声明可安全使用的组件/props/tokens,并告知接入方式(providers、全局样式等)。导入工作流包含5个步骤:收集来源(设计系统包、源码、Storybook 等)、配置环境变量、补充备注、自动生成 v0.json、审查启动应用。v0.json 仅含机器可复用部分,包括 referenceWorkspace.sources(最多3个只读源)、environment.providers、starter。更新 skill 不会自动迁移旧项目,需显式重写。AI产品v0Design Systems 2.0GitHub设计系统编程助手推荐理由:v0 出了一招:把你的设计系统注册成一个 skill,之后每次生成 app 都用真组件,不用反复描述样式,省大事了。原文
10:30IT之家(博客/媒体)苹果正式发布 Xcode 26.6 IDE,新增对谷歌 Gemini 编程助手的支持,与 Anthropic Claude Agents 和 OpenAI Codex 共同作为可选 AI 提供商。该版本包含 Swift 6.3.3 以及 iOS 26.5、iPadOS 26.5 等 SDK。同时新增 ACP 兼容能力,并修复了多个 Bug 以提升稳定性。目前 Xcode 26.6 已在 App Store 免费提供下载。AI产品XcodeGeminiClaudeCodex编程助手10 个信源在谈推荐理由:苹果Xcode更新了,现在可以直接用Gemini、Claude或Codex帮你写代码,开发者的新选择。原文
10:19GitHub Blog@Natalie Guevara精选GitHub Copilot agentic harness 在多项基准测试中展现优异性能,同时实现领先的 token 效率。该框架支持超过 20 种不同模型,提供灵活的模型选择。评测覆盖多种任务类型,验证了其通用性。AI产品GitHub Copilotagentic harnesstoken效率编程助手基准测试推荐理由:GitHub 官方的代理框架评测,Copilot 在不同模型上又快又省 token,支持 20 多种模型,搞编程智能体的别错过。原文
09:47arXiv cs.AI@Hartwig Grabowski论文提出Spec Growth Engine框架,解决AI编码代理的两个结构性失效:上下文爆炸和规范-代码漂移。框架包含机器可读的规范图(节点携带明确契约/设计分离)、Spine上下文组装器(将代理上下文限定到所有权路径)、垂直切片增长协议(强制最难优先排序)和漂移门(使规范-代码分歧成为阻塞合并条件)。该设计综合Parnas信息隐藏、C4、ADR、Walking Skeleton、Reflexion Models、Fitness Functions等成熟工程原则,形成轻量级代码耦合整体,无需RUP或MDA等重型框架。论文Spec Growth EngineAI辅助软件开发编程助手规范驱动推荐理由:这篇论文很实在,专门解决AI写代码时规范和代码脱节、上下文爆炸的难题。作者搞了个轻量框架,用规范图和漂移门来管住,适合做AI辅助开发的工程实践参考。原文
08:51Viking@vikingmute精选Ornith-1.0 系列开源模型发布,专门用于 agentic coding,参数从9B Dense到397B MoE全覆盖。在 Terminal-Bench 2.1 上得分77.5,SWE-Bench verified 82.4,NL2Repo 48.2。397B MoE模型在多个基准上超过 Claude Opus 4.7。模型采用自改进训练策略,利用强化学习同时生成解决方案和 task-specific scaffold。基于 gemma4 和 qwen3.5 后训练,MIT 许可开源。AI模型Ornith-1.0gemma4qwen3.5开源模型编程助手3 个信源在谈推荐理由:Ornith-1.0 开源了从9B到397B的编程模型,在SWE-Bench等基准上超越Claude Opus 4.7,还能自己优化任务框架。原文
08:29@OpenAIDevs@OpenAIDevs73°OpenAI 宣布 Codex 在 ChatGPT 移动应用正式可用,支持一对一设备配对,让手机和电脑更安全连接。新增通知、目标、侧边聊天、文件预览和内联审阅评论功能。用户可在移动端启动作业、审查输出、引导执行和批准下一步,Codex 仍在笔记本电脑或 Mac mini 上运行。AI产品CodexChatGPTOpenAI移动应用编程助手10 个信源在谈推荐理由:OpenAI 让 Codex 在手机 App 里也能用了,能一边在电脑跑代码、一边在手机上跟进和审批,还多了侧边聊天和文件预览。原文