AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:代码生成×
6月30日
09:19
09:19掘金本周最热@猫猫头啊
精选
文章对比了Step 3.7 Flash、DeepSeek V4 Flash、Gemini 3.5 Flash在Agent场景下的代码生成效率、响应速度和工具调用稳定性。测试采用Claude Code工具,第一个案例从零搭建开发者日志站,Step 3.7 Flash一次生成,输出25.7k tokens,成本¥1.22,耗时2m30s;DeepSeek V4 Flash成本¥0.72,输出14k tokens。第二个案例搭建GitHub项目雷达,Step 3.7 Flash无错误完成,Gemini 3.5 Flash有2次自动修复报错。在视觉效果和稳定性上Step 3.7 Flash表现更优,但DeepSeek V4 Flash成本更低。
AI模型Step 3.7 FlashDeepSeek V4 FlashGemini 3.5 Flash智能体代码生成

推荐理由:最近这几个Flash模型我帮你试了,Step 3.7 Flash写博客页和抓GitHub项目都很稳,页面好看,一次跑通,成本也就一两块钱,值得试试。
原文
6月29日
18:02
18:02IT之家(博客/媒体)
根据编程助手Cursor的数据,过去半年里无需人工审核直接上线生产环境的AI生成代码变更占比显著上升。AI产出代码的留存通过率也随之大幅提升,表明开发者认为其可靠性正在提高。尽管Cursor未直接量化代码质量,但平台数据显示AI在软件开发流程中承担更多工作。
AI产品CursorAI编码智能体代码生成编程助手

推荐理由:Cursor最近的数据告诉我们,开发者越来越敢让AI代码直接上线了,不用人盯着。比例半年涨了不少,说明AI写的代码确实更靠谱了。
原文
6月27日
12:23
12:23Decoder@Matthias Bastian
精选
Epoch AI 发布新基准 MirrorCode,测试 AI 模型能否在无原始代码时重建完整程序。Claude Opus 4.7 以 56% 的解决率领先,曾在 14 小时内重建 16,000 行工具包。个别模型为单个 MirrorCode 任务连续运行 19 天,花费 2,600 美元。所有测试模型在最复杂任务上均失败。
AI模型MirrorCodeEpoch AIClaude Opus 4.7代码生成基准测试

推荐理由:Epoch AI 搞了个新基准 MirrorCode,专测 AI 能不能凭空抄作业。Claude Opus 4.7 解了一半,但最难的题全挂,甚至有个模型烧了 19 天才花掉 2600 刀。
原文
6月26日
16:21
16:21Pandaily@contact@pandaily.com (Pandaily)
阿里巴巴的 TRAE Work 平台新增 Design 模式,将需求分析、界面设计与代码生成整合在一个 AI 环境中。该模式下,用户可直接从 sketched wireframes 或 Figma 设计稿生成前端代码,支持 React/Vue 等框架。TRAE Work 基于通义千问模型,此次更新实现了从需求文档到可运行代码的闭环。
AI产品TRAEAlibaba编程助手代码生成设计模式

推荐理由:阿里 TRAE Work 加了个 Design 模式,现在能直接拿需求文档或设计稿生成代码,省去中间环节。
原文
6月24日
16:25
16:25marktechpost@Michal Sutter
文章对比了2026年16款生成式AI编码工具,分析了其核心特征与最佳适用场景。这些工具从逐行自动补全扩展到全应用生成、多智能体构建流水线。无需手动配置即可生成前端、后端和基础设施代码。适用于初级AI工程师和软件工程师。
AI产品生成式AI编码工具代码生成编码助手工具对比

推荐理由:还在手动写代码?2026年16款AI编码工具大比拼,看哪个最适合你的项目。从补全到全栈生成,一篇搞定选型。
原文
13:30
13:30量子位@henry
Anthropic对其编程助手Claude Code进行了重要升级。目前该公司约65%的产品代码已由Claude Tag参与完成。这表明AI在大型模型公司的内部开发中渗透率已相当高。
AI产品Claude CodeAnthropicClaude Tag编程助手代码生成

推荐理由:Claude Code又升级了,Anthropic自家65%的代码都用它写,编程助手的能力值得一试。
原文
6月19日
11:28
11:28marktechpost@Sana Hassan
本文使用Hugging Face加载的Salesforce CodeGen实现端到端工作流。除基础推理外,添加函数提取、语法检查、静态安全检查和单元测试验证。对最佳N个候选项进行重排序,组合多轮程序合成并实验不同提示风格。最后可视化迷你基准测试并将生成的工件导出为可复用文件。
技巧Salesforce CodeGenHugging FacePython代码生成单元测试

推荐理由:手把手教你用Salesforce CodeGen写Python函数,还能自动验证和重排序,适合想提升代码生成质量的开发者。
原文
6月18日
11:09
11:09IT之家(博客/媒体)
72°
华为昇腾宣布0 Day支持智谱GLM-5.2,昇腾A3系列已实现单双机及大EP推理部署。优化技术包括MOE大融合算子、通信与计算融合、注意力前处理与多Token预测、高并发调度与预填充延迟机制等。GLM-5.2在Code Arena盲测中取得全球可用模型第一,拥有1M上下文能力,长程任务表现介于Claude Opus 4.7与4.8之间。该模型在主流编程基准上保持开源SOTA,并已适配华为昇腾等国产算力平台。
AI模型GLM-5.2华为昇腾推理优化开源模型代码生成

推荐理由:华为昇腾0 Day适配智谱GLM-5.2,推理优化让长上下文编程更高效,开源模型性能比肩Claude Opus。
原文
02:35
02:35Simon Willison’s Weblog(博客/媒体)
Charity Majors指出,2025年代码生产的经济学被彻底改变:生成代码变得几乎免费且即时。过去珍贵、被精心维护的代码行,如今变成可丢弃和可重新生成的消耗品。她强调,这反而要求更强的工程纪律,而非更少。
行业Charity MajorsAI辅助编程代码生成工程纪律

推荐理由:Charity Majors说,AI让写代码像免费喝水,但更需要工程纪律,而不是更松懈。值得一看。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月10日
12:17
12:17Simon Willison’s Weblog(博客/媒体)
精选
Simon Willison 发布了 llm 0.32a3 版本,该版本的代码几乎完全由 Anthropic 的新模型 Claude Fable 5 编写。这标志着 AI 辅助编程进入新阶段,开发者只需描述需求即可获得完整实现。Simon 在博客中详细记录了这一过程,展示了 AI 生成代码的质量和效率。对于使用 llm 工具或关注 AI 编程的开发者来说,这是一个值得关注的里程碑。
AI产品Claude Fable 5llmAI 编程代码生成开源/仓库

推荐理由:Simon Willison 用实践证明了 Claude Fable 5 的代码生成能力,做工具开发或 AI 编程的团队可以看看 AI 如何独立完成一个完整项目,值得点开了解细节。
原文
6月6日
16:39
16:39IT之家(博客/媒体)
Anthropic 通过数据标注公司 Snorkel AI 的“Marlin”项目,雇佣约 1000 名人类软件工程师来微调 Claude Code 的性能。外包人员每项任务(约一小时)报酬 280 美元,负责编写提示词、审查代码并进行 A/B 测试,以训练模型生成更简化、易维护的代码。该项目旨在让 Claude Code 更贴近真实开发环境,目前仍在进行中,外包人员不知道所评估的模型版本。此举反映了 AI 公司依赖人类反馈来提升模型质量的行业趋势。
AI产品Claude CodeAnthropic代码生成人类反馈外包训练

推荐理由:Anthropic 用真金白银砸出更懂开发的 Claude Code,做 AI 编程工具或依赖代码生成模型的团队值得关注——人类工程师的精细反馈正在定义下一代编程助手的质量天花板。
原文
6月5日
16:33
16:33IT之家(博客/媒体)
腾讯内部调整AI Token额度分配机制,从全员统一改为按工作任务动态调配,强调总投入只增不减。新机制保障能带来显著提效和价值产出的员工Token额度,不搞消耗量排名,避免焦虑。有员工代码量是他人3倍,管理升级后未受影响,反而获增配额。此前腾讯高管表示今年大部分代码由AI生成,工程师更专注架构设计。
行业腾讯AI Token资源分配代码生成管理机制

推荐理由:腾讯这次调整解决了AI资源分配中的公平与效率问题,做AI工具或内部AI平台的团队值得关注,看看如何平衡投入与产出。
原文
11:09
11:09IT之家(博客/媒体)
腾讯高级执行副总裁汤道生在腾讯云AI产业应用大会上透露,今年腾讯大部分代码由AI生成,工程师更多时间用于架构设计和指导AI。腾讯已重组AI研发团队,搭建Hy3 preview模型,AI全面提速。腾讯总裁刘炽平表示,去年AI投入180亿元,今年至少翻倍。这一趋势表明AI正深度改变软件开发流程,工程师角色从写代码转向监督和优化AI输出。
行业AI编程代码生成腾讯工程师AI基础设施

推荐理由:腾讯作为国内科技巨头,其AI生成代码的实践对软件开发团队有直接参考价值——工程师可以少写代码、多关注架构,建议关注AI编程的团队点开看看。
原文
6月2日
00:33
00:33Hugging Face: Blog(博客/媒体)
精选72°
JetBrains 发布了 Mellum2,一个 12B 参数的混合专家(MoE)模型,专为代码生成和软件工程任务优化。该模型在 HumanEval 和 SWE-bench 等基准测试中表现优异,超越了同等规模的模型。Mellum2 基于 JetBrains 的代码数据训练,旨在为开发者提供更高效、更准确的代码补全和生成能力。该模型现已开源,可在 Hugging Face 上获取。
AI模型JetBrainsMellum2MoE代码生成开源/仓库

推荐理由:JetBrains 的 Mellum2 为 IDE 内代码生成带来了更精准的 MoE 方案,用 JetBrains 全家桶的开发者可以直接在 Hugging Face 上体验,看看它能否提升你的编码效率。
原文
5月20日
03:04
03:04IT之家(博客/媒体)
76°
在2026谷歌I/O大会上,谷歌宣布推出专为科研设计的Gemini模型——Gemini for Science。该模型能够追踪最新论文、将研究目标转化为可执行代码,并生成新的科学假设。谷歌还提及了模拟人工智能的未来方向,计划模拟更复杂的系统甚至虚拟细胞。目前,谷歌已有多个项目处于临床前阶段,涵盖免疫疾病和癌症,旨在加速药物发现过程。
AI产品Gemini科研助手论文追踪代码生成药物发现

推荐理由:科研人员终于有了AI助手来追踪论文和写实验代码,做生物医药或材料科学的团队可以直接用Gemini for Science加速研究,建议点开看看具体怎么用。
原文
5月18日
11:39
11:39IT之家(博客/媒体)
腾讯云宣布自研 AI 设计智能体平台 Ardot 正式公测,支持通过一句话快速生成可编辑的 App 页面、官网、海报、插画、PPT 等设计稿。该平台能调用团队业务组件库,确保设计符合规范,并可直接导入 Figma 文件保留原有布局。Ardot 对代码友好,设计稿可一键转代码,兼容 CodeBuddy、Cursor、Claude Code 等 MCP IDE。此外,平台还提供多人在线协作、实时评论、版本对比等功能,微信小程序即将上线。
AI产品AI 设计设计稿生成代码生成协作平台腾讯

推荐理由:设计团队终于有了一个能直接对接开发的 AI 工具——Ardot 把「一句话出设计稿」和「一键转代码」打通了,做 UI/UX 的设计师和前端开发者可以省掉大量重复沟通和手动还原的时间,建议试试。
原文
5月13日
06:17
06:17OpenAI Blog(博客/媒体)
OpenAI发布了与NVIDIA工程师和研究人员的合作案例,展示了Codex结合GPT-5.5如何帮助团队构建生产系统并将研究想法快速转化为可运行的实验。该工具显著提升了代码生成和实验迭代效率。这表明AI辅助开发正从原型阶段进入规模化生产应用。
AI产品编程助手代码生成NVIDIAGPT-5.5研发效率

推荐理由:典型案例揭示了AI编程助手在大型企业研发流程中的实际应用价值,对评估AI辅助工具在工业界的落地效果有参考意义。
原文
精选全部日报登录