全部 AI 动态 · AI 热点

6月30日

09:19

掘金本周最热@猫猫头啊

精选

文章对比了Step 3.7 Flash、DeepSeek V4 Flash、Gemini 3.5 Flash在Agent场景下的代码生成效率、响应速度和工具调用稳定性。测试采用Claude Code工具，第一个案例从零搭建开发者日志站，Step 3.7 Flash一次生成，输出25.7k tokens，成本¥1.22，耗时2m30s；DeepSeek V4 Flash成本¥0.72，输出14k tokens。第二个案例搭建GitHub项目雷达，Step 3.7 Flash无错误完成，Gemini 3.5 Flash有2次自动修复报错。在视觉效果和稳定性上Step 3.7 Flash表现更优，但DeepSeek V4 Flash成本更低。

AI模型 Step 3.7 Flash DeepSeek V4 Flash Gemini 3.5 Flash 智能体代码生成

推荐理由：最近这几个Flash模型我帮你试了，Step 3.7 Flash写博客页和抓GitHub项目都很稳，页面好看，一次跑通，成本也就一两块钱，值得试试。

原文

6月29日

18:02

18:02IT之家（博客/媒体）

根据编程助手Cursor的数据，过去半年里无需人工审核直接上线生产环境的AI生成代码变更占比显著上升。AI产出代码的留存通过率也随之大幅提升，表明开发者认为其可靠性正在提高。尽管Cursor未直接量化代码质量，但平台数据显示AI在软件开发流程中承担更多工作。

AI产品 Cursor AI编码智能体代码生成编程助手

推荐理由：Cursor最近的数据告诉我们，开发者越来越敢让AI代码直接上线了，不用人盯着。比例半年涨了不少，说明AI写的代码确实更靠谱了。

原文

6月27日

12:23

Decoder@Matthias Bastian

精选

Epoch AI 发布新基准 MirrorCode，测试 AI 模型能否在无原始代码时重建完整程序。Claude Opus 4.7 以 56% 的解决率领先，曾在 14 小时内重建 16,000 行工具包。个别模型为单个 MirrorCode 任务连续运行 19 天，花费 2,600 美元。所有测试模型在最复杂任务上均失败。

AI模型 MirrorCode Epoch AI Claude Opus 4.7 代码生成基准测试

推荐理由：Epoch AI 搞了个新基准 MirrorCode，专测 AI 能不能凭空抄作业。Claude Opus 4.7 解了一半，但最难的题全挂，甚至有个模型烧了 19 天才花掉 2600 刀。

原文

6月26日

16:21

Pandaily@contact@pandaily.com (Pandaily)

阿里巴巴的 TRAE Work 平台新增 Design 模式，将需求分析、界面设计与代码生成整合在一个 AI 环境中。该模式下，用户可直接从 sketched wireframes 或 Figma 设计稿生成前端代码，支持 React/Vue 等框架。TRAE Work 基于通义千问模型，此次更新实现了从需求文档到可运行代码的闭环。

AI产品 TRAE Alibaba 编程助手代码生成设计模式

推荐理由：阿里 TRAE Work 加了个 Design 模式，现在能直接拿需求文档或设计稿生成代码，省去中间环节。

原文

6月24日

16:25

marktechpost@Michal Sutter

文章对比了2026年16款生成式AI编码工具，分析了其核心特征与最佳适用场景。这些工具从逐行自动补全扩展到全应用生成、多智能体构建流水线。无需手动配置即可生成前端、后端和基础设施代码。适用于初级AI工程师和软件工程师。

AI产品生成式AI编码工具代码生成编码助手工具对比

推荐理由：还在手动写代码？2026年16款AI编码工具大比拼，看哪个最适合你的项目。从补全到全栈生成，一篇搞定选型。

原文

13:30

量子位@henry

Anthropic对其编程助手Claude Code进行了重要升级。目前该公司约65%的产品代码已由Claude Tag参与完成。这表明AI在大型模型公司的内部开发中渗透率已相当高。

AI产品 Claude Code Anthropic Claude Tag 编程助手代码生成

推荐理由：Claude Code又升级了，Anthropic自家65%的代码都用它写，编程助手的能力值得一试。

原文

6月19日

11:28

marktechpost@Sana Hassan

本文使用Hugging Face加载的Salesforce CodeGen实现端到端工作流。除基础推理外，添加函数提取、语法检查、静态安全检查和单元测试验证。对最佳N个候选项进行重排序，组合多轮程序合成并实验不同提示风格。最后可视化迷你基准测试并将生成的工件导出为可复用文件。

技巧 Salesforce CodeGen Hugging Face Python 代码生成单元测试

推荐理由：手把手教你用Salesforce CodeGen写Python函数，还能自动验证和重排序，适合想提升代码生成质量的开发者。

原文

6月18日

11:09

11:09IT之家（博客/媒体）

72°

华为昇腾宣布0 Day支持智谱GLM-5.2，昇腾A3系列已实现单双机及大EP推理部署。优化技术包括MOE大融合算子、通信与计算融合、注意力前处理与多Token预测、高并发调度与预填充延迟机制等。GLM-5.2在Code Arena盲测中取得全球可用模型第一，拥有1M上下文能力，长程任务表现介于Claude Opus 4.7与4.8之间。该模型在主流编程基准上保持开源SOTA，并已适配华为昇腾等国产算力平台。

AI模型 GLM-5.2 华为昇腾推理优化开源模型代码生成

推荐理由：华为昇腾0 Day适配智谱GLM-5.2，推理优化让长上下文编程更高效，开源模型性能比肩Claude Opus。

原文

02:35

02:35Simon Willison’s Weblog（博客/媒体）

Charity Majors指出，2025年代码生产的经济学被彻底改变：生成代码变得几乎免费且即时。过去珍贵、被精心维护的代码行，如今变成可丢弃和可重新生成的消耗品。她强调，这反而要求更强的工程纪律，而非更少。

行业 Charity Majors AI辅助编程代码生成工程纪律

推荐理由：Charity Majors说，AI让写代码像免费喝水，但更需要工程纪律，而不是更松懈。值得一看。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日