全部 AI 动态 · AI 热点

6月29日

13:49

Microsoft AI@MicrosoftAI

微软宣布MAI-Code-1-Flash模型现已面向GitHub Copilot Business和Enterprise用户全面开放。该模型专注于代码生成，强调速度和效率，旨在帮助开发者用更少资源构建更多功能。MAI-Code-1-Flash是微软内部开发的轻量级代码模型，针对商业和企业级使用场景优化。通过集成到GitHub Copilot，用户可直接在代码编辑器中获得实时补全和建议。

AI模型 MAI-Code-1-Flash GitHub Copilot Microsoft 编程助手代码生成

推荐理由：微软把自家MAI-Code-1-Flash模型放进GitHub Copilot了，写代码更快更省资源，Business和Enterprise用户赶紧试试。

原文

13:49

Microsoft AI@MicrosoftAI

精选

微软推出新编程模型 MAI-Code-1-Flash，在真实 GitHub Copilot 环境中训练，具备高速和 token 高效特性。该模型可通过 VS Code 的 Copilot Chat 完成规划、构建、运行和测试。演示中，它从单个 frost banner 生成完整季节性快照并通过测试，耗时几分钟，成本仅几美分。

AI模型 MAI-Code-1-Flash Microsoft 编程助手代码生成 GitHub Copilot

推荐理由：微软出了个新模型 MAI-Code-1-Flash，直接在 Copilot 里跑，能自动把草图变成完整测试通过的代码，又快又便宜。

原文

6月28日

23:45

Aadit Sheth@aaditsh

Elon Musk 宣布 Grok 4.5 基于 1.5T 参数的 V9 基础模型，并加入 Cursor 代码数据进行补充训练，已在 SpaceX 和 Tesla 内部私有 beta 测试。早期评估显示其性能接近甚至可能超过 Opus 模型，RL 持续优化模型。SpaceX 计划今年每月发布一个完全从零训练的新模型。目前 Cursor 拥有 700 万日活开发者，多数因使用 Claude 开始使用 Cursor。

AI模型 Grok 4.5 Cursor SpaceX Opus 代码生成

推荐理由：Grok 4.5 用 Cursor 数据训练，性能直逼 Opus，而且 SpaceX 要每月发新模型，代码圈和 AI 圈都该看看。

原文

6月26日

02:58

Gary Marcus@GaryMarcus

Anthropic工程师在一场40分钟工作坊中展示了如何利用循环（loops）构建可运行数天的AI智能体。他们透露，Anthropic内部30%以上的代码已由循环编写，这极大加快了交付速度。工作坊拆解了智能体循环、工具调用、记忆管理和子智能体等核心组件。该方法被视为神经符号AI的典型应用，在持久任务执行上明显优于传统无循环生成式方法。

技巧 Anthropic 智能体 Agent循环工作流代码生成

推荐理由：Anthropic工程师手把手教你用循环搭建能跑好几天的智能体，内部30%代码都这么写，比大部分500美元的vibe编程课实在。

原文

6月25日

05:39

lmarena.ai@lmarena_ai

71°

GLM-5.2 (Max) 在 Code Arena: Frontend 排名第二，仅次于 Fable 5，但击败了 Claude Opus 4.8 (Thinking) 和 Opus 4.7 (Thinking)。对 Kimi-K2.6 胜率 61.0%，对 Sonnet 4.6 胜率 59.4%，对 Opus 4.7 (Thinking) 胜率 55.0%。最接近的挑战来自 GPT-5.5 (xHigh)（41.7% vs 40.0%）和 Opus 4.6（47.0% vs 42.4%）。与前任 GLM-5.1 打成平手（45.5% - 45.5%）。在 Brand & Marketing、Data & Analytics 等多项子类别中排名第一。

AI模型 GLM-5.2 Opus Kimi-K2.6 代码生成前端开发

推荐理由：GLM-5.2 在前端任务上干掉了 Claude Opus 系列，对 Kimi 和 Sonnet 胜率超 60%，开源模型里相当能打。

原文

03:24

Genspark@genspark_ai

Genspark 推出 Genspark Design，一款基于 Claude Opus 4.7 的 AI 设计工具。用户无需设计背景即可从草图生成专业设计，支持 UI 原型、视频、HTML 动画和海报。可上传 Figma 文件或保存设计复用于项目，并一键将设计转化为工作代码（基于 Genspark Code）。目前处于首发定价阶段。

AI产品 Genspark Design Claude Opus 4.7 设计工具代码生成 Figma

推荐理由：不用学设计软件，上传 Figma 或画个草图就能出 UI、视频、动画，还能一键转代码，设计师和产品经理都该试试。

原文

6月24日

10:42

AI Will@FinanceYF5

精选

Anthropic发布了Claude Tag，将其嵌入Slack，用户可在频道中像@同事一样@它分配任务。该功能在频道内共享上下文，无需重复解释。开启ambient模式后，Claude Tag会主动跟进未解决的任务。Anthropic内部65%的代码由Claude Tag生成。目前Enterprise和Team用户可用。

AI产品 Anthropic Claude Tag Slack 智能体代码生成

推荐理由：把Claude当同事用：Slack里@它分配任务，自动记忆上下文，Ambient模式主动跟进未解决问题。

原文

6月23日

12:52

Ate-a-Pi@svpino

如果你还在人工审查全部AI生成的代码，那说明效率太低。代码审查已成为软件开发的最大瓶颈。Santiago Valdarrama（@svpino）分享了改进方法，核心是减少审查范围、使用自动化工具、建立信任机制。他建议只审查关键路径代码，利用AI辅助审查，并逐步放宽对低风险代码的审查比例。

技巧代码生成 AI编程代码审查开发效率工作流

推荐理由：Santiago Valdarrama说别傻了，100%审查AI代码拖慢整个团队。他给了具体改进策略：缩小审查范围、用工具自动化，让开发快起来。

原文

6月21日

15:25

@koltregaskes@koltregaskes

GLM-5.2 在 DeepSWE 编程基准上取得 44% 的得分，超过 Kimi-K2.7 Code，成为目前最强的开源模型。不过它的运行成本更高，且每次输出更多 tokens。与封闭模型相比，Claude Fable 5 以 70% 的得分领先，差距明显。

AI模型 GLM-5.2 Kimi-K2.7 DeepSWE 开源模型代码生成

推荐理由：智谱的 GLM-5.2 代码上刚赢了 Kimi 的 K2.7，但更贵输出也更多，离顶级闭源还有距离。

原文

15:09

AI Will@FinanceYF5

Bessemer Venture Partners的最新调研显示，90%的技术/工程团队已将AI融入核心流程。具体数据：代码生成工具使用率92%，代码审查增强工具使用率79%，Agentic开发工具使用率60%。调研指出，团队间的真正差距不在于是否使用AI，而在于提速后能否维持代码质量和业务理解。

行业代码生成代码审查 Agentic开发 AI工程 BVP

推荐理由：BVP调研数据很实在：92%团队在用AI写代码，但真正拉开差距的是质量和理解，不是工具本身。

原文

14:59

idoubi@idoubicc

clonesite.ai 由 lumina__team 的 D 哥开发，能通过输入网址自动复刻网页，还原度达到95%以上。复刻过程中使用 browser-cli 对源网站进行语义重建和截图比对，每个元素经校对，最终交付基于 TanStack 的 TSX 组件代码。该工具目前仅支持单页面复刻，用户需在复刻完成后付费下载整套代码，用于项目冷启动。

AI产品 clonesite.ai lumina__team TanStack 网页复刻代码生成

推荐理由：D 哥做的 clonesite.ai 能直接输入网址复刻网页，还原度95%以上，交付 TanStack 代码，比同类 Agent 都准。

原文

6月19日

11:00

Augment Code@augmentcode

Augment Code 团队在 Cosmos 项目中使用一个 worker agent 处理整个设计文档，生成单个数千行 PR。该 agent 不仅实现设计，还自行修复 CI 失败并处理审查意见，无需拆 ticket 或 agent 间交接。团队认为单 agent 持有完整上下文能产出更连贯的变更，避免分块导致的假设不一致。此方法适用于大型项目，与多数团队的小范围 agent 工作方式形成对比。

技巧 Augment Cosmos 智能体代码生成 PR

推荐理由：Augment Code 分享了他们如何让一个 agent 一口气完成整个设计文档实现，省去拆 ticket 和接力，适合做大项目的人参考。

原文

6月18日

13:07

@atomic_chat_hq@atomic_chat_hq

精选

智谱GLM-5.2与月之暗面Kimi K2.7 Code在三个物理模拟HTML5编程任务中对比。GLM-5.2使用12,640 tokens完成全部任务，包括台球碰撞、弹簧上方方块弹跳和高尔顿板，粒子和动量表现正确。Kimi K2.7 Code仅用7,420 tokens，但三个场景均出现严重错误：方块穿透弹簧、台球碰撞不真实、高尔顿板珠子重叠。评测显示GLM-5.2在物理模拟细节和精度上显著优于Kimi K2.7 Code。

AI模型 GLM-5.2 Kimi K2.7 智谱代码生成物理模拟

推荐理由：智谱的GLM-5.2写物理模拟代码完胜Kimi K2.7，三个场景全部精准，Kimi翻车在弹簧穿透和球乱撞上。

原文

13:02

@atomic_chat_hq@atomic_chat_hq

精选

Fable 5 模型在三个真实物理模拟任务（混沌双摆、高尔顿板、WCSPH 旋转桶中水）中生成的 HTML5 仿真效果优于 Opus 4.8。水模拟中，Fable 5 生成的水体更连续稳定，而 Opus 4.8 在器壁附近出现较大空隙、粒子散落且流体不稳定。Fable 5 的生成成本为 3.35 美元（68.7k tokens，耗时 14 分 47 秒），Opus 4.8 为 0.93 美元（38.9k tokens，耗时 8 分 10 秒）。

AI模型 Fable 5 Opus 4.8 物理模拟代码生成 HTML5

推荐理由：Fable 5 写物理仿真比 Opus 4.8 更扎实，尤其水粒子效果更真实，虽然贵了点但值得一试。

原文

13:00

@atomic_chat_hq@atomic_chat_hq

StepFun 的 Step 3.7 Flash 模型与 DeepSeek V4-Flash 在物理动画生成任务中直接对比。任务要求编写自包含 HTML5 Canvas 动画，包含高尔顿板、旋转六边形中弹跳的球、五个同步节拍器三个场景。Step 3.7 Flash 输出 59.6k tokens (9分57秒)，DeepSeek V4-Flash 输出 52.5k tokens (6分21秒)。虽然 DeepSeek 更快，但 StepFun 在物理模拟、视觉效果和逻辑渲染三个维度全面获胜。

AI模型 Step 3.7 Flash DeepSeek V4-Flash StepFun 代码生成基准测试

推荐理由：StepFun 的 Step 3.7 Flash 在生成物理动画上把 DeepSeek V4-Flash 比下去了，慢点但模拟和画面都好很多。

原文

05:56

elvis@omarsar0

精选

Block 公司构建了名为 Builderbot 的内部 AI 系统，通过 orchestrator 代理协调多个代理跨代码库工作。工程师在 Slack 中标记 Builderbot，系统即可自动研究、规划并发布代码。该平台每天处理 200,000 次操作，每周合并 1,500 个拉取请求，占 Block 全部生产代码变更的 15%。原本需要数月的工作现在只需数天完成。

AI产品 Builderbot Block 智能体代码生成编程助手

推荐理由：Block 内部搞了个 Builderbot，每天自动处理 20 万次操作、合并 1500 个 PR，把几个月的工作缩短到几天，效率太猛了。

原文

01:12

elvis@omarsar0

Boris Cherny指出，AI代码生成正迈入新阶段，模型能对越来越多任务生成正确代码。关键在于设置合适的护栏，并使用Claude Code配合高级模型和验证器（verifier）构成循环。开发者需持续喂入任务数据，识别并消除瓶颈。这种工作流能显著提升代码生成的准确率。

技巧 Claude Code 验证器代码生成编程助手工作流

推荐理由：Cherny分享了用Claude Code和验证器循环生成正确代码的实战方法，不是空谈趋势，值得想提升代码质量的开发者一试。

原文

6月17日

05:29

ollama@ollama

GLM-5.2 在 Design Arena 上以 1360 Elo 获得第一名，超过此前领先的 Claude Fable 5。该模型开源权重，排名较此前上升 4 位，Elo 提升 27 分。这使其成为 Design Arena 代码类别历史上最高 Elo 之一。GLM-5.2 由 Zai_org 发布。

AI模型 GLM-5.2 Design Arena Zai_org 开源模型代码生成

推荐理由：GLM-5.2 在代码设计赛上跑了第一，1360 Elo，超过 Claude Fable 5，还开源了，值得试试。

原文

03:01

LangChain@LangChainAI

LangSmith Sandboxes 允许 agent 在响应前验证生成的代码是否运行。适用于构建编码助手、CI agent 或数据管道等需要操作真实文件的场景。该功能解决了 agent 仅能描述而不能实际执行的问题。

AI产品 LangSmith 智能体代码生成 CI工具数据管道

推荐理由：LangSmith 推出了 Sandboxes，让 agent 真正跑代码并验证结果。适合做编程助手、CI 自动化或数据处理。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

20:29

AlphaSignal@AlphaSignalAI

精选

MPMWorlds是一个包含95,000个2D仿真视频的基准，覆盖液体、雪、沙子和弹性体。模型观看2.5秒场景后预测后续运动。代码生成方法能保持长期物理稳定性，但无法从帧中读取位置，隐藏坐标后精度骤降。扩散模型可捕获短期几何，但物体随时间消失、运动不真实。混合两种方法的简单门控机制超越单一模型。

论文 MPMWorlds 物理模拟代码生成扩散模型视频理解

推荐理由：这篇论文用MPMWorlds测试了AI看视频写物理代码的能力，发现代码生成稳但缺位置感知，扩散模型短时准但长期漂移，混合模型效果最好。

原文

19:02

kimmonismus@kimmonismus

VibeThinker-3B是仅3B参数的小模型，在AIME26上取得94.3分，在LiveCodeBench v6上Pass@1达80.2，在未见过的LeetCode比赛中正确率96.1%。其训练基于Qwen2.5-Coder，结合课程SFT、多领域RL、离线自蒸馏和最终RL指导阶段。结果表明，部分可验证推理能力可被高效压缩到小密集模型中。

AI模型 VibeThinker-3B Qwen2.5-Coder 推理模型小模型代码生成

推荐理由：3B的小模型在数学和代码推理上快追上大模型了，适合部署在低算力场景，值得关注。

原文

09:03

berryxia@berryxia

精选

12B参数的Gemma 4 12B Coder GGUF模型基于Google的gemma-4-12B-it微调，专门针对代码生成和复杂推理。训练数据使用了Composer 2.5的真实通过案例，并由Fable 5辅助补全困难case，确保推理步骤导向可运行代码。模型采用GGUF格式，可在12GB显存的显卡甚至CPU上离线运行。下载量已突破6000，社区反馈在本地代码调试、补全、算法生成等场景表现出色。

AI模型 Gemma 4 12B Coder GGUF Fable 5 代码生成本地模型

推荐理由：Gemma 4 12B Coder 把 Fable 5 的推理链蒸馏到本地，12GB 显卡就能跑顶级代码生成，再也不用担心 API 费用和限制

原文

6月13日

13:01

elvis@omarsar0

Thorsten Ball在Day 3测试中，用Fable和deep^2实现跨CLI、Web服务器和另一服务器的功能。deep^2在去健身房前完成，花费20美元，但第一次运行未成功。Fable运行1小时40分钟，花费350美元，第一次尝试即成功。后续追问后Fable总花费升至457美元。两者都理解任务并构建了相同功能。

AI产品 Fable deep^2 编程助手代码生成 Amp

推荐理由：Fable贵17倍但一次成功，deep^2便宜需调试

原文

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

02:36

Perplexity@perplexity_ai

精选

Perplexity 宣布将 Deep Research 作为原生技能集成到其 Computer 产品中。该功能现在连接到驱动 Computer 的智能体框架，能够访问搜索、代码生成、长期运行的沙箱、连接器、工具和授权数据。这一整合使得用户可以在 Computer 环境中直接进行深度研究，无需切换工具。该功能目前对 Pro 和 Max 订阅用户开放。

AI产品 Perplexity Deep Research 智能体搜索代码生成

推荐理由：Perplexity 把深度研究能力直接嵌入到智能体框架里，做研究或数据分析的团队可以省去来回切换工具的麻烦，Pro/Max 用户值得立刻试试。

原文

6月11日

21:52

rohanpaul_ai@rohanpaul_ai

一篇论文提出，AI Agent 可能从根本上改变软件的本质，使代码不再是核心产物。传统软件是“冻结的意图”，而 Agent 能在运行时将意图转化为行动，生成代码作为一次性工具。这种转变是从预设计行为到协商行为的转变，系统会随条件变化持续解释目标。但这也带来新风险：静态程序在边界内失败，而 Agent 可能因漂移、过度自信或错误累积而失败。未来工程师不再是提示词写手或数字实习生监督者，而是定义意图、约束自主性、设计评估和检查推理轨迹的人。

论文 AI Agent 软件范式代码生成自主系统风险评估

推荐理由：这篇论文点出了 AI Agent 对软件范式的根本冲击——代码不再是最终产品，做架构设计或系统开发的团队值得一读，看完会对 Agent 的风险和工程师的新角色有更深理解。

原文

17:55

AI Will@FinanceYF5

一位用户让 Claude Fable 5 编写一个单行道红绿灯模拟程序，要求车辆随机进入并可视化呈现。模型严格遵循指令，只输出了可视化部分，没有添加任何额外功能或注释。这展示了 Claude Fable 5 在精确执行 prompt 方面的能力，对于需要干净、无冗余代码的开发者来说是一个亮点。

AI产品 Claude Fable 5 代码生成可视化红绿灯模拟 prompt 执行

推荐理由：对于追求 prompt 精准执行的 AI 编程用户，这个案例展示了 Claude Fable 5 如何严格按需求输出，不画蛇添足。做原型或演示的开发者可以借鉴这种干净输出的风格。

原文

16:53

AI Will@FinanceYF5

AI模型 Claude Fable 5 前端开发代码生成排行榜 Anthropic

推荐理由：前端开发者可以关注这个新标杆——Claude Fable 5 在 HTML 和 React 子榜全拿第一，做 UI 生成或组件开发的团队值得试试。

原文

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

09:01

lmarena.ai@lmarena_ai

88°

Claude Fable 5 在 Code Arena 前端榜单中排名第一，全面领先 Opus-4.8。它在所有子榜单（HTML、React）和所有子类别（品牌营销、参考设计、数据分析、消费产品、游戏、模拟、内容创作工具）中均位列第一。同时，Fable 5 在 Agent Arena 中也以最大优势领先 Opus-4.8 和 GPT-5.5，在任务成功率和用户评价上表现突出，尽管可操控性稍弱。该模型在数百万真实世界长期代理任务中测试，涵盖代码编写、幻灯片制作、网页研究、应用构建和文档分析。Anthropic 的这一里程碑标志着前端开发与智能体领域的重要进步。

AI模型 Claude Fable 5 前端开发智能体代码生成 Anthropic

推荐理由：前端开发者可以直接用 Fable 5 提升 HTML/React 项目效率，智能体任务执行能力也远超竞品，做复杂自动化流程的团队值得关注。

原文

6月10日

14:19

AI Will@FinanceYF5

83°

开发者 Riley Brown 使用 Claude Fable (Mythos) 模型，仅通过一条提示就构建了一个类似 Replit 的移动应用，该应用能够构建、预览、编辑 Web 应用。提示中指定了使用 Daytona 进行沙盒隔离、Convex 作为数据库。整个过程展示了 Claude 在代码生成和复杂应用构建方面的强大能力，从单条提示到完整功能应用仅需一步。

AI产品 Claude 代码生成应用构建 Replit 全栈开发

推荐理由：这条消息展示了 Claude 在代码生成上的惊人突破——单条提示就能构建一个功能完整的 Replit 克隆，做全栈开发的团队值得看看，这可能会改变你构建原型的方式。

原文

13:54

歸藏(guizang.ai)@op7418

博主归藏测试了 Fable 5 模型，发现其在漏洞分析和 bug 寻找方面表现很强，但在代码生成上并不完美，写出的代码常有明显 bug，需要多次修复。相比 Fable 4.8，Fable 5 在某些方面提升显著，但在另一些方面提升有限，整体呈现偏科特点。该测试提醒开发者不要盲目依赖单一模型，需根据任务场景选择合适工具。

AI模型 Fable 5 漏洞分析代码生成模型评测偏科

推荐理由：做安全审计或漏洞分析的开发者可以重点关注 Fable 5 的强项，但写代码的团队要谨慎——它可能不是万能替代品，建议实测后再决定是否迁移。

原文

13:51

歸藏(guizang.ai)@op7418

用户归藏测试了 Fable 5 模型，发现其在漏洞分析和 bug 寻找方面表现很强，但在代码生成上并不完美，写出的代码常有明显 bug，需要多次修复才能完成。整体来看，Fable 5 是一个偏科严重的模型，某些方面比 4.8 好很多，但另一些方面提升有限。该评测为开发者提供了实际使用中的参考。

AI模型 Fable 5 模型评测漏洞分析代码生成偏科模型

推荐理由：做安全审计或漏洞分析的开发者可以重点关注 Fable 5 的强项，但写代码时别完全依赖它——实测有坑，建议搭配其他模型使用。

原文

13:48

AI Will@FinanceYF5

83°

开发者 Chris 使用 Claude 5 fable (extra high) 模型，通过单条提示“Make a Pokémon clone”生成了一款完整的宝可梦克隆游戏。模型经过1小时推理，一次性输出了约8000行代码，包含了全部151只第一代宝可梦的真实精灵图（正面/背面）、队伍图标、叫声、基础属性、类型、升级技能表、进化链、捕获率和成长曲线。这一成果展示了大型语言模型在复杂游戏开发中的潜力，无需多次迭代即可生成完整功能。

AI产品 Claude 游戏开发代码生成宝可梦 AI产品

推荐理由：游戏开发者或AI爱好者会震惊——Claude 用单条提示就完成了通常需要团队数周的工作，想测试AI极限的人可以直接看代码。

原文

11:44

Cognition@cognition_labs

精选76°

Devin 平台现已集成 Claude Fable 5 模型，该模型在 FrontierCode 基准测试中排名第一。FrontierCode 是评估真实工程任务中代码合并性和质量的基准。这一更新意味着开发者可以在 Devin 中使用当前最强的代码生成模型之一，提升自动化编程效率。

AI产品 Devin Claude Fable 5 代码生成基准测试编程助手

推荐理由：对于使用 Devin 做自动化编程的团队，Fable 5 的集成直接提升了代码质量和合并成功率，值得立即体验。

原文

00:13

Google Gemini App@GeminiApp

精选

Gemini 3.5 Flash 能处理复杂视觉数据并转化为可运行的交互代码。它可分析参考图像的照明条件，构建一个交互式3D可视化器来预览光照设置。该模型演示了从视觉输入到功能性代码的端到端能力。

AI模型 Gemini 3.5 Flash 代码生成 3D可视化 Google

推荐理由：看Gemini 3.5 Flash从图生成3D代码

原文

6月9日

12:44

AI Will@FinanceYF5

Claude Code负责人Boris Cherny分享了他个人工作方式的巨大转变：6个月前所有代码还是他手写，现在全部由Claude生成。他的角色从写代码变成了向Claude描述功能需求，然后审查和微调结果。这反映了AI编程助手正在从根本上改变开发者的工作模式，从执行者转变为管理者。对于开发者而言，这意味着需要适应新的协作方式，而非被替代。

AI产品 Claude Code AI编程助手开发者工作流代码生成 Boris Cherny

推荐理由：Boris Cherny的亲身经历揭示了AI编程的落地真相——不是替代开发者，而是把开发者从手写代码中解放出来。做开发的团队和个人，建议看看这种新工作流怎么落地。

原文

6月7日

09:48

Greg Brockman@gdb

精选

OpenAI联合创始人Greg Brockman在推文中分享了他使用Codex的体会。他反思自己不使用Codex时，原因通常是缺少上下文（93次提及）、需要编写Skill（21次转发），或单纯没想到（657个赞）。他认为很少因为任务超出模型能力，当前模型能力“过盈”感觉很大（26164次查看）。这段经验提示开发者应多尝试用Codex，问题多出在应用方式而非能力限制。

技巧 Codex OpenAI 代码生成编程助手

推荐理由：Codex比你想象得更强

原文

6月4日

16:44

AI Will@FinanceYF5

在 Build 大会上，某团队一次性发布了七款新模型，覆盖推理、代码生成、图像处理、语音转录和语音合成等核心能力。这些模型从零构建，采用干净的数据血统，追求极致效率，并作为一个模型家族无缝协作。此举展示了多模态 AI 模型家族化发展的新趋势，为开发者提供了更全面的工具链。

AI产品推理模型代码生成图像生成语音合成多模态

推荐理由：多模态模型家族化是当前 AI 发展的关键方向，做全栈 AI 应用的开发者可以直接关注这七款模型如何协作，提升开发效率。

原文

6月3日

08:24

a16z@a16z

a16z 合伙人 Yoko Li 指出，当前最有趣的视觉 AI 工具不再直接生成像素，而是生成最终输出背后的源代码。这一转变解锁了可编辑性、迭代能力和反馈循环，这是纯像素模型无法比拟的。视觉代码生成市场正围绕运行时（artifact 渲染或执行的环境）进行组织。这标志着视觉 AI 从“生成图片”向“生成可编辑的代码”演进，为设计师和开发者提供了更灵活的工作流。

行业视觉AI 代码生成 a16z 设计工具前端开发

推荐理由：a16z 点出了视觉 AI 从像素到代码的关键转向，做设计工具、前端开发或创意编程的团队值得关注——这可能是下一代视觉工作流的底层逻辑。

原文

6月2日

10:16

@OpenAIDevs@OpenAIDevs

OpenAI 宣布其 Codex 模型现已集成到 Amazon Bedrock 平台，开发者可以直接在 AWS 环境中使用 Codex 进行代码生成和自动化任务。这一集成降低了使用门槛，让 AWS 用户无需额外配置即可调用 Codex 的能力。Codex 擅长将自然语言转换为代码，适用于快速原型开发、自动化脚本编写等场景。此举标志着 OpenAI 与 AWS 的深度合作，进一步拓展了 Codex 在企业级应用中的覆盖范围。

AI产品 Codex Amazon Bedrock 代码生成 AWS OpenAI

推荐理由：AWS 开发者终于可以在 Bedrock 里直接用 Codex 写代码了，省去跨平台调用的麻烦，做云上自动化的团队建议试试。

原文

09:05

Aravind Srinivas@AravSrinivas

精选76°

Perplexity CEO Arav Srinivas 宣布，公司正从传统的“搜索作为网络抓取工具调用”转向“搜索即代码”架构。新架构让 AI 智能体直接编写 Python 代码调用搜索栈，而非逐次循环函数调用。这一转变旨在适应未来智能体环境中代码执行成为知识工作主流方式的趋势，使多步骤原语组合更自然，对智能体框架的变更更具适应性，并能受益于下一代模型在编程能力上的持续提升。该架构已通过 Perplexity Agent API 提供，并默认用于 Computer 模式。

AI产品搜索即代码 Perplexity 智能体 AI 架构代码生成

推荐理由：Perplexity 把搜索从工具调用升级为代码生成，解决了智能体多步搜索效率低、难适配的问题。做 AI 智能体或搜索产品的开发者值得关注，可以直接在 Agent API 里体验。

原文