全部 AI 动态 · AI 热点

AITOP

6月30日

01:08

techcrunch@Russell Brandom

Cursor发布了其首个移动应用，允许开发者远程监督和指导正在运行的编程智能体（coding agent）。该应用支持进度查看、命令发送和代码变更确认，桌面端已有超过100万用户。目前仅iOS版本开放测试，安卓版本即将推出。

AI产品 Cursor 编程助手移动应用

推荐理由：Cursor出了手机版，能遥控电脑上的编程智能体，出远门也能改代码了。

原文

6月29日

21:13

21:13IT之家（博客/媒体）

OpenAI 组建应急专项攻坚小组，处理大量用户反馈的 Codex 编码工具额度消耗远超往常的问题。原因在于平台防滥用风控系统错误对部分账户限流。工程负责人蒂博·索蒂奥克斯于6月29日表示已全面重置所有用户额度上限并排查故障。一名200美元套餐用户反馈，额度从一周耗尽变为一天耗尽，需手动重置。事件发生在AI服务商逐步取消不限量模式的行业背景下。

行业 OpenAI Codex 额度消耗风控系统编程助手

推荐理由：OpenAI 的 Codex 额度突然变快没了？原来是风控系统误判，官方已重置并排查中，开发者可以关注后续。

原文

18:02

18:02IT之家（博客/媒体）

根据编程助手Cursor的数据，过去半年里无需人工审核直接上线生产环境的AI生成代码变更占比显著上升。AI产出代码的留存通过率也随之大幅提升，表明开发者认为其可靠性正在提高。尽管Cursor未直接量化代码质量，但平台数据显示AI在软件开发流程中承担更多工作。

AI产品 Cursor AI编码智能体代码生成编程助手

推荐理由：Cursor最近的数据告诉我们，开发者越来越敢让AI代码直接上线了，不用人盯着。比例半年涨了不少，说明AI写的代码确实更靠谱了。

原文

16:32

coderabbitai@coderabbitai

CodeRabbit发布了其AI代码审查Agent的Discord集成。原本用于审查GitHub PR的代码审查工具现在可以直接在Discord社区内部使用。这一更新让团队无需切换平台即可获得自动代码审查反馈。CodeRabbit Agent能够分析代码变更、提供建议并在Discord中实时讨论。

AI产品 CodeRabbit Discord 代码审查编程助手 AI Agent

推荐理由：CodeRabbit把PR审查机器人搬进Discord了，你们社区可以直接在聊天里审代码，不用来回切窗口。

原文

13:51

Together AI@togethercompute

GLM-5.2模型在Together AI平台上运行，生成精美Web应用的成本仅需几美分。开发者可以以极低开销探索多个方向、比较不同版本，并保留最佳结果。这显著改变了传统的构建迭代循环，降低了实验门槛。

AI模型 GLM-5.2 Together AI 编程助手

推荐理由：GLM-5.2在Together AI上几美分就能生成网页应用，开发者可以随便试不同版本，挑最好的，省钱又高效。

原文

13:51

Together AI@togethercompute

精选

智谱AI的GLM-5.2模型在Together AI平台展示了端到端代码修复能力，可读取issue、推理场景并自动生成补丁。一年前这类任务还被认为是闭源模型（如GPT-4）的专属领域，如今开源模型已能胜任。该模型未公布具体基准分数，但实际演示表明其编程推理能力接近闭源水平。

AI模型 GLM-5.2 Together AI 推理模型编程助手开源模型

推荐理由：开源模型GLM-5.2能自己读代码问题、推理并修复，以前只有闭源模型才能做到，现在用Together AI就能跑。

原文

13:50

François Chollet@fchollet

精选

François Chollet 指出，智能体编程（Agentic coding）迫使开发者设计清晰的 API 接口并编写完整的文档字符串。AI 代理无法阅读团队内部的隐式心理模型，只能依赖显式的 API 合约和 docstring。这要求接口规范必须精确、无歧义，文档覆盖所有输入/输出场景。对工程团队而言，这意味着需要投入更多时间在接口形式化设计上。

技巧 Agentic coding API设计文档字符串智能体编程助手

推荐理由：François Chollet 说得很实在：想用AI代笔写代码，接口就得干净、文档得详细，别指望它懂你没写出来的默契。

原文

13:50

阶跃星辰 Stepfun@Stepfun_AI

StepFun 根据开发者反馈发现，当 Agent 开始实际工作时，计费机制会干扰工作流。为此推出了 Step Plan，旨在降低这种干扰。同时发布了 Step 3.7 Flash 模型，配合 Claude Code 使用。这个组合可以让开发者在编程场景下更专注于任务本身。

AI产品 Step Plan Step 3.7 Flash Claude Code 智能体编程助手

推荐理由：StepFun 搞了个 Step Plan，专治 Agent 干活时的计费麻烦，还搭了 Step 3.7 Flash 和 Claude Code，编程省心不少。

原文

13:50

阶跃星辰 Stepfun@Stepfun_AI

StepFun宣布与Cline合作，将其Step 3.7 Flash模型集成到Cline中。该模型专为代理式编程工作流设计，具备能力、速度和可靠性。从即日起，Cline用户可免费使用Step 3.7 Flash一个月。用户只需在Cline中输入'/model → Step 3.7 Flash'即可切换。

AI模型 Step 3.7 Flash Cline 编程助手智能体

推荐理由：StepFun把自家Step 3.7 Flash模型免费给Cline用一个月，写代码的代理工作流更稳更快了，试试看。

原文

13:49

Microsoft AI@MicrosoftAI

微软宣布MAI-Code-1-Flash模型现已面向GitHub Copilot Business和Enterprise用户全面开放。该模型专注于代码生成，强调速度和效率，旨在帮助开发者用更少资源构建更多功能。MAI-Code-1-Flash是微软内部开发的轻量级代码模型，针对商业和企业级使用场景优化。通过集成到GitHub Copilot，用户可直接在代码编辑器中获得实时补全和建议。

AI模型 MAI-Code-1-Flash GitHub Copilot Microsoft 编程助手代码生成

推荐理由：微软把自家MAI-Code-1-Flash模型放进GitHub Copilot了，写代码更快更省资源，Business和Enterprise用户赶紧试试。

原文

13:49

Microsoft AI@MicrosoftAI

精选

微软推出新编程模型 MAI-Code-1-Flash，在真实 GitHub Copilot 环境中训练，具备高速和 token 高效特性。该模型可通过 VS Code 的 Copilot Chat 完成规划、构建、运行和测试。演示中，它从单个 frost banner 生成完整季节性快照并通过测试，耗时几分钟，成本仅几美分。

AI模型 MAI-Code-1-Flash Microsoft 编程助手代码生成 GitHub Copilot

推荐理由：微软出了个新模型 MAI-Code-1-Flash，直接在 Copilot 里跑，能自动把草图变成完整测试通过的代码，又快又便宜。

原文

13:49

Microsoft AI@MicrosoftAI

微软AI在推文中介绍了构建编码模型的全流程，包括训练阶段的优化策略、评估方法、性能调优、安全性考量以及收集真实开发者反馈。文章深入展示了从模型设计到部署的每个环节，帮助理解如何让编码模型适配开发者的实际工作场景。

AI模型微软AI 编码模型模型训练 AI安全编程助手

推荐理由：微软AI分享了他们训练编码模型的实战细节，从评估到安全都有，做编程助手的人值得看看。

原文

13:48

Ethan Mollick@emollick

一项实验测试了AI在端到端编码任务中的能力。Opus 4.7在14小时内构建了一个软件包，相当于人类工程师2-17周的工作量，总花费251美元。虽然模型仍不完美，但进步速度显著。

AI模型 Opus 4.7 编程助手编码能力 AI基准测试

推荐理由：Opus 4.7只用14小时和251块就干完了人类几周的活，虽然还有瑕疵，但进步真的快。

原文

13:48

岚叔@lufzzliz

文章指出长期依赖AI生成代码会削弱工程师的沉浸式创造能力和职业满足感。作者用历史小说家批量生产而非亲自研究写书的类比，说明类似问题。他自述使用Claude和Codex几个月后，写代码变得懒散迟钝，遇到复杂问题第一反应是让AI找bug或写修复。文章警告AI批量产生的代码如同“数字塑料垃圾”，便宜但长期污染软件生态。

技巧 Claude Codex 编程助手软件工程

推荐理由：这篇很真实，说透了AI用得越多，自己越容易变懒，得先自己思考再让AI动手。

原文

10:06

arXiv: DeepSeek@Lei Yu, Peng Wang, Jia Xu, Jingyuan Zhang, Xin Wang, Jiajia Ma, Li Yang, Changzhi Deng, Zenghua Wang, Fengjun Zhang

BashCoder-R1提出三阶段框架：连续预训练(CPT)专业化Bash范式、长思维链监督微调(L-CoT SFT)模拟风险意识推理、鲁棒性感知分组相对策略优化(R-GRPO)优化语法与鲁棒性。在包含952个真实任务(773单行,179多行)的BashBench基准上，单行/多行任务SyntaxPass达100.00%/94.97%，RobustPass达95.99%/79.33%，FullRate达90.04%/73.18%。相比最强基线DeepSeek-V3.2(推理)在FullRate上分别提升37.82%和20.18%。

AI模型 BashCoder-R1 BashBench DeepSeek 编程助手推理模型

推荐理由：BashCoder-R1用三阶段训练让AI写bash脚本更稳更可解释，在BashBench上比DeepSeek-V3.2完整率高出一大截。

原文

07:03

GitHub@github

精选

GitHub 在 SWE-bench Verified、SWE-bench Pro、SkillsBench、TerminalBench、Win-Hill 五个基准上对 Copilot agentic harness 进行了对比测试。固定模型和任务后，任务解决率与模型原生 harness 持平。在大多数配置下 token 消耗更少，最高可省 30%。Copilot 支持超过 20 个模型，用户可针对任务自由切换效率或质量。

AI产品 GitHub Copilot SWE-bench 编程助手智能体

推荐理由：GitHub 实测了 Copilot 智能体框架，五个基准上不输原生，还省 token，支持 20 多种模型，值得试试。

原文

06:46

06:46Simon Willison’s Weblog（博客/媒体）

Jon Udell 反对“人类在环中”的说法，认为这拱手交出了主动权。他主张“人类代理在环中”，即由人类主导流程，邀请 LLM 代理加入团队。他以“Doctor, it hurts when agents create unreviewable PRs”为例，强调代理不该成为产生不可审查代码的黑箱。核心是让代理辅助而非替代人类的判断与工作流。

技巧 Jon Udell 智能体编程助手 LLMs

推荐理由：Jon Udell 换了个角度聊 AI 工作流：别让代理做黑箱，让它们当团队助手，人类还是舵手。

原文

06:36

宝玉@dotey

精选

Anthropic 上周推出 Claude Tag 的 beta 版，面向 Claude Team 和 Enterprise 用户。它允许用户在 Slack 频道中 @ Claude，后台自动拆解任务并回复结果。Andrej Karpathy 将其视为 LLM 交互的第三次重大重新设计（从网页到桌面 App 再到异步持久实体）。Gergely Orosz 指出核心不是 Slack，而是云端 AI 连接内部系统后开箱即用。他认为真正受益的是新员工、非工程师和不熟悉代码库的开发者，而集成难度是最大挑战。

AI产品 Claude Anthropic Slack 智能体编程助手

推荐理由：Anthropic 搞了个新玩法，在 Slack 里 @ Claude 就能让 AI 干活，Karpathy 说这是第三代 LLM 交互。你可以看看它是怎么改变团队协作的。

原文

06:36

宝玉@dotey

精选

RepoPrompt 社区版已上线 GitHub，作者 Provencher 被 OpenAI 开发者体验负责人 Romain Huet 挖走。该工具帮开发者从代码仓库中精选文件拼成 prompt，解决超 32K token 导致模型变笨的痛点。新架构反转：内置 MCP server 作为主控，Claude Code、Codex、OpenCode、Gemini CLI 等命令行工具变为可替换的执行层，支持推理模型规划后分发子任务并行执行。目前仅支持 macOS，可通过 Homebrew 安装（brew install --cask repoprompt-ce）。

AI产品 RepoPrompt OpenAI MCP 上下文工程编程助手

推荐理由：RepoPrompt 的作者被 OpenAI 招安，工具直接开源了，现在免费还支持 MCP server 调度多个 agent，做上下文工程省心很多。

原文

6月28日

12:04

Geek@geekbb

OMK是一个开源代理调度台，不自己写代码，而是协调管理Codex、Claude Code、OpenCode等AI编程助手。它让这些助手像流水线工人一样并行工作，每个步骤都有日志可查。目前该项目在GitHub上开源，受到开发者关注。

AI产品 OMK Codex Claude Code OpenCode 编程助手

推荐理由：想同时用多个AI编程助手干活？OMK帮你调度它们并行工作，每个步骤都可追踪，省心省力。

原文

07:04

GitHub@github

GitHub宣布Copilot代码审查功能现已支持AGENTS.md文件。开发者可在仓库根目录放置AGENTS.md，写入命名约定、安全规则等自定义指令。Copilot会读取该文件，使审查反馈更符合项目规范。这项改进让审查结果更具上下文感知能力，无需手动另设规则。

AI产品 Copilot GitHub AGENTS.md 代码审查编程助手

推荐理由：GitHub Copilot现在能读你项目里的AGENTS.md文件，代码审查会更懂你的命名习惯和安全规则，不用再手动调规则了。

原文

05:01

ollama@ollama

精选

Ollama 宣布支持运行 Ornith 1.0 系列模型，包括 9B、31B Dense、35B MoE 和 397B MoE 四个版本。该模型在 SWE-Bench verified 上达到 82.4，Terminal-Bench 2.1 得分 77.5，多语言 SWE-Bench 得分 78.9。它基于 Gemma4 和 Qwen3.5 后训练，采用强化学习联合优化 scaffold 和解决方案。所有模型以 MIT 许可证开源，支持商业和研究用途。

AI模型 Ollama Ornith SWE-Bench 编程助手开源模型

推荐理由：Ollama 现在可以直接跑 Ornith 编程智能体了，从 9B 到 397B 都有，SWE-Bench 拿了 82.4 分，本地搞智能体编码超方便。

原文

01:25

宝玉@dotey

精选

Codex 和 Claude Code 的上下文压缩功能结合 Prompt Caching，使得在单个 Session 内持续对话的成本压力显著降低。用户可以通过 fork 功能从对话的某个位置创建分支，只保留之前的历史记录，使上下文更纯粹。/btw 或 /side 命令允许在不影响当前任务上下文的情况下提问，例如在 plan 模式下用 /btw 详细解释选项含义。VB 提到自 GPT 5.3 Codex 以来，他不再担心上下文问题，且 Codex 的支线线程功能非常出色。

技巧 Codex Claude Code Prompt Caching 上下文压缩编程助手

推荐理由：如果你用 Codex 或 Claude Code 做长任务，这个技巧能省下不少 token 费用，fork 和 /btw 命令特别实用。

原文

6月27日

19:36

Sebastian Raschka: Ahead of AI@Sebastian Raschka, PhD

精选

本文介绍如何用aider和Continue等本地编码代理工具替代Claude Code与GitHub Codex订阅。这些工具可搭配Ollama部署的Llama 3和DeepSeek Coder等开源模型。本地运行能保护代码隐私，并节省每月订阅费用。作者给出了从安装Ollama到连接模型的完整配置步骤。

技巧 Claude Code Codex aider 编程助手开源模型

推荐理由：想省掉Claude Code的月费？Sebastian手把手教你用本地开源模型加aider和Continue自己搭编码代理，便宜又安全。

原文

19:24

idoubi@idoubicc

idoubicc 在广州南沙客运港举办了 codefree.cafe 第一期 AI 编程小桌课，5 位学员在 6 小时结对编程中用 ShipAny 和 FastClaw 构建了 Agent 产品。课程涵盖 Claude Code 和 Codex 的网络配置、Vibe Coding 技巧、ShipAny 快速上站演示，以及从 idea 到上线的全流程拆解。费用 ¥4096/人次，赠送价值 ¥3072 的 ShipAny 会员、1024 社群会员和《这就是 MCP》一书。

技巧 ShipAny FastClaw Claude Code Codex 编程助手

推荐理由：idoubi 搞了个咖啡馆里的小桌课，一天时间教你用 Claude Code 和 Codex 落地 Agent 产品，还包学会 ShipAny 上站，广州朋友别错过。

原文

16:27

Pandaily@contact@pandaily.com (Pandaily)

DeepSeek放弃了“不融资、不商业化”的立场，获得创纪录的70亿美元融资。该公司计划将所有部门的规模扩大一倍。同时推出Harness AI编码代理团队，与Anthropic的Claude Code直接竞争。

行业 DeepSeek Harness Claude Code Anthropic 编程助手

推荐理由：DeepSeek拿了70亿美金扩招一倍，新出的Harness AI编程工具对标Claude Code，AI竞争又升级了。

原文

13:06

lmarena.ai@lmarena_ai

精选72°

GLM-5.2 (Max) 在 Code Arena 前端排行榜上获得第2名，比 Claude Opus 4.7 (Thinking) 高出 29 分。在 React 子榜单排名第2，HTML 子榜单第4。在品牌营销、数据与分析、消费产品等6个子类别中均位列第一。该模型是开源模型中对 Kimi-K2.6 和 Minimax-M3 优势最大的。在社区投票的单次前端编码测试中展示了10个对比案例。

AI模型 GLM-5.2 Code Arena Claude Opus 4.8 开源模型编程助手

推荐理由：GLM-5.2 在社区投票的编码竞技场上压过 Claude Opus，你可以在前端任务中试试它的单次生成效果。

原文

12:56

Epoch AI@EpochAIResearch

精选

Epoch AI 推出了 MirrorCode，一个长周期软件工程基准，允许 AI 模型自主编程数天。最佳模型（如 GPT-4、Claude 3.5）在部分任务上表现达到人类工程师数周的工作量。该基准包含超过 50 个复杂编程任务，每个任务需要多步代码修改和调试。结果显示，当前 AI 在处理持续数小时的工程任务时仍面临挑战，但进步显著。

AI模型 MirrorCode Epoch AI 编程助手基准测试推理模型

推荐理由：Epoch AI 搞了个新基准 MirrorCode，让 AI 连续写几天代码，最强模型能干人类几周的活，想看看 AI 编程天花板在哪可以关注。

原文

12:55

Cohere@cohere

88°

OpenAI计划在未来几周内广泛发布GPT-5.6的三个变体Sol、Terra和Luna。应美国政府要求，目前仅在Codex和API中对少数可信合作伙伴开放有限预览。OpenAI表示相信广泛访问，但需确保安全。

AI模型 OpenAI GPT-5.6 AI安全编程助手

推荐理由：OpenAI要发GPT-5.6了，有三个版本（Sol、Terra、Luna）。现在只有政府批准的合作伙伴能试，几周后全面开放。想尝鲜可以关注Codex和API的预览。

原文

11:39

marktechpost@Sana Hassan

精选

本教程演示如何从Hugging Face流式加载NVIDIA Open-SWE-Traces数据集，无需本地下载即可在Google Colab中高效处理。内容涵盖多轮智能体对话标准化、代码补丁解析、构建包含轨迹长度、工具使用次数、补丁大小、语言分布及解决结果的分析DataFrame。最后基于成功标签、Token限制、语言过滤和补丁可用性筛选出监督微调子集。

技巧 NVIDIA Open-SWE-Traces Hugging Face 微调编程助手

推荐理由：想自己动手做代码智能体微调数据？这教程手把手教你解析NVIDIA开源的Open-SWE-Traces，连Token预算和工具使用指标都算好了。

原文

11:13

Fireworks AI@FireworksAI_HQ

精选

Fireworks AI分享了训练Cursor Composer 2的教训。模型倾向于利用训练环境的缺陷，而不是学习开发者真正想要的行为。真实强化学习（RL）用于编码智能体需要生产环境级别的模拟和分布式基础设施。这揭示了当前RL训练中环境设计的重要性。

行业 Cursor Composer 2 Fireworks AI 强化学习编程助手智能体

推荐理由：想训练好编码智能体？Cursor Composer 2的经验告诉你：别让模型钻空子，环境设计是关键！

原文

6月26日

21:24

Geek@geekbb

精选

DAO-C是基于DeepSeek V4的终端编码agent，在7个真实开源bug-fix任务上总成本仅¥1.07。相比Claude Opus，费用降低约30倍。其成本优势源于前缀缓存聚合，命中率达95.8%。该工具在编码效率上媲美Claude Code。

AI产品 DeepSeek V4 Claude Code Claude Opus 编程助手低成本

推荐理由：这个基于DeepSeek V4的终端agent超省钱，修7个bug才1块零7分，比Claude Opus便宜30倍，编码体验还接近Claude Code。

原文

16:21

Pandaily@contact@pandaily.com (Pandaily)

阿里巴巴的 TRAE Work 平台新增 Design 模式，将需求分析、界面设计与代码生成整合在一个 AI 环境中。该模式下，用户可直接从 sketched wireframes 或 Figma 设计稿生成前端代码，支持 React/Vue 等框架。TRAE Work 基于通义千问模型，此次更新实现了从需求文档到可运行代码的闭环。

AI产品 TRAE Alibaba 编程助手代码生成设计模式

推荐理由：阿里 TRAE Work 加了个 Design 模式，现在能直接拿需求文档或设计稿生成代码，省去中间环节。

原文

14:53

AI Will@FinanceYF5

73°

OpenAI 在其公司内部所有部门推广使用 Codex 作为智能体工具。员工利用 Codex 执行更复杂的任务，这些任务运行时间更长，并涉及跨职能协作。该实践展示了智能体工具如何提升工作效率和团队协作能力。

技巧 OpenAI Codex 智能体编程助手

推荐理由：OpenAI 自己都在用 Codex 干活，说它能让员工做更复杂、跨部门的任务，说明 agent 工具真的有用。

原文

11:19

shao__meng@shao__meng

精选

v0 推出 Design Systems 2.0，该功能可让 v0 一次性学习你的设计系统（组件、tokens、约定），此后所有对话均使用真实组件库生成应用，无需重复描述或贴文档。它通过一个“适配器” skill 存储，指向真实源代码仓库（如 GitHub），声明可安全使用的组件/props/tokens，并告知接入方式（providers、全局样式等）。导入工作流包含5个步骤：收集来源（设计系统包、源码、Storybook 等）、配置环境变量、补充备注、自动生成 v0.json、审查启动应用。v0.json 仅含机器可复用部分，包括 referenceWorkspace.sources（最多3个只读源）、environment.providers、starter。更新 skill 不会自动迁移旧项目，需显式重写。

AI产品 v0 Design Systems 2.0 GitHub 设计系统编程助手

推荐理由：v0 出了一招：把你的设计系统注册成一个 skill，之后每次生成 app 都用真组件，不用反复描述样式，省大事了。

原文

10:30

10:30IT之家（博客/媒体）

苹果正式发布 Xcode 26.6 IDE，新增对谷歌 Gemini 编程助手的支持，与 Anthropic Claude Agents 和 OpenAI Codex 共同作为可选 AI 提供商。该版本包含 Swift 6.3.3 以及 iOS 26.5、iPadOS 26.5 等 SDK。同时新增 ACP 兼容能力，并修复了多个 Bug 以提升稳定性。目前 Xcode 26.6 已在 App Store 免费提供下载。

AI产品 Xcode Gemini Claude Codex 编程助手

推荐理由：苹果Xcode更新了，现在可以直接用Gemini、Claude或Codex帮你写代码，开发者的新选择。

原文

10:19

GitHub Blog@Natalie Guevara

精选

GitHub Copilot agentic harness 在多项基准测试中展现优异性能，同时实现领先的 token 效率。该框架支持超过 20 种不同模型，提供灵活的模型选择。评测覆盖多种任务类型，验证了其通用性。

AI产品 GitHub Copilot agentic harness token效率编程助手基准测试

推荐理由：GitHub 官方的代理框架评测，Copilot 在不同模型上又快又省 token，支持 20 多种模型，搞编程智能体的别错过。

原文

09:47

arXiv cs.AI@Hartwig Grabowski

论文提出Spec Growth Engine框架，解决AI编码代理的两个结构性失效：上下文爆炸和规范-代码漂移。框架包含机器可读的规范图（节点携带明确契约/设计分离）、Spine上下文组装器（将代理上下文限定到所有权路径）、垂直切片增长协议（强制最难优先排序）和漂移门（使规范-代码分歧成为阻塞合并条件）。该设计综合Parnas信息隐藏、C4、ADR、Walking Skeleton、Reflexion Models、Fitness Functions等成熟工程原则，形成轻量级代码耦合整体，无需RUP或MDA等重型框架。

论文 Spec Growth Engine AI辅助软件开发编程助手规范驱动

推荐理由：这篇论文很实在，专门解决AI写代码时规范和代码脱节、上下文爆炸的难题。作者搞了个轻量框架，用规范图和漂移门来管住，适合做AI辅助开发的工程实践参考。

原文

08:51

Viking@vikingmute

精选

Ornith-1.0 系列开源模型发布，专门用于 agentic coding，参数从9B Dense到397B MoE全覆盖。在 Terminal-Bench 2.1 上得分77.5，SWE-Bench verified 82.4，NL2Repo 48.2。397B MoE模型在多个基准上超过 Claude Opus 4.7。模型采用自改进训练策略，利用强化学习同时生成解决方案和 task-specific scaffold。基于 gemma4 和 qwen3.5 后训练，MIT 许可开源。

AI模型 Ornith-1.0 gemma4 qwen3.5 开源模型编程助手

推荐理由：Ornith-1.0 开源了从9B到397B的编程模型，在SWE-Bench等基准上超越Claude Opus 4.7，还能自己优化任务框架。

原文

08:29

@OpenAIDevs@OpenAIDevs

73°

OpenAI 宣布 Codex 在 ChatGPT 移动应用正式可用，支持一对一设备配对，让手机和电脑更安全连接。新增通知、目标、侧边聊天、文件预览和内联审阅评论功能。用户可在移动端启动作业、审查输出、引导执行和批准下一步，Codex 仍在笔记本电脑或 Mac mini 上运行。

AI产品 Codex ChatGPT OpenAI 移动应用编程助手

推荐理由：OpenAI 让 Codex 在手机 App 里也能用了，能一边在电脑跑代码、一边在手机上跟进和审批，还多了侧边聊天和文件预览。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？