AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:编码能力×
6月29日
13:48
13:48Ethan Mollick@emollick
一项实验测试了AI在端到端编码任务中的能力。Opus 4.7在14小时内构建了一个软件包,相当于人类工程师2-17周的工作量,总花费251美元。虽然模型仍不完美,但进步速度显著。
AI模型Opus 4.7编程助手编码能力AI基准测试

推荐理由:Opus 4.7只用14小时和251块就干完了人类几周的活,虽然还有瑕疵,但进步真的快。
原文
6月17日
12:40
12:40orange.ai@oran_ge
GLM-5.2 由 Z.ai 发布,在编码和智能体任务上取得显著进步,首次让开源模型在 Coding 能力上达到 Opus 水平。模型支持 1M 上下文窗口,提供两种推理努力级别(max 和 high),权重采用 MIT 开源许可,API 定价与 GLM-5.1 相同。
AI模型GLM-5.2Z.ai开源模型编码能力推理模型

推荐理由:Z.ai 开源了 GLM-5.2,编码水平追上 Opus,还给了 1M 上下文和两种推理模式,MIT 许可随便用。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月4日
01:28
01:28SiliconFlowAI@siliconflowai
83°
MiniMax 最新开源模型 M3 已在 SiliconFlow 平台上线,首周提供 50% 折扣。M3 是首个同时具备编码与智能体能力、1M 上下文窗口和原生多模态的开源模型。在 SWE-Bench Pro 基准测试中,M3 的编码能力超越了 GPT-5.5 和 Gemini 3.1 Pro。其 1M 上下文窗口通过 MiniMax 稀疏注意力技术实现,原生多模态支持图像、视频和计算机使用。定价方面,缓存/输入/输出分别为每百万 token 0.06/0.30/1.20 美元,折扣后性价比突出。
AI模型MiniMaxM3开源模型编码能力多模态

推荐理由:M3 把编码、长上下文和多模态三合一开源了,做 AI 应用开发的团队可以直接在 SiliconFlow 上低成本试用,编码能力还超过了 GPT-5.5,值得上手体验。
原文
6月2日
10:35
10:35Harrison Chase@hwchase17
精选76°
MiniMax 正式发布 M3 模型,这是首个同时具备编码、智能体能力和原生多模态的开放权重模型。在 SWE-Bench Pro 上达到 59.0%,Terminal Bench 2.1 为 66.0%,并支持 1M 上下文窗口。模型权重和技术报告将在约 10 天后公开。开发者可通过 API 和专属代码平台 code.minimax.io 使用。
AI模型MiniMaxM3开源模型编码能力智能体

推荐理由:MiniMax M3 把编码、智能体和多模态三合一开源,做 AI 应用和 Agent 开发的团队可以直接拿来用,尤其适合需要长上下文和复杂任务自动化的场景。
原文
5月14日
15:02
15:02xiaomimimo@XiaomiMiMo
73°
小米MiMo-V2.5-Pro在最新Arena排行榜(2026年4月26日)中取得多项突破:在Text Arena专家级排名全球第6、开源模型第1,并在中国模型中排名第1,小米实验室整体排名全球第3,仅次于Anthropic和OpenAI。该模型在Text Arena综合排名中位列开源第2,在Code Arena网页开发排名中位列开源第3。此外,在Hard Prompts、指令遵循、长查询等4个子榜单中均获开源第1。这些成绩基于真实社区盲评,反映了模型的实际能力。
AI模型小米MiMo-V2.5-Pro开源模型排行榜编码能力

推荐理由:小米MiMo-V2.5-Pro在多个高难度榜单中超越众多闭源模型,做模型选型或关注开源生态的开发者值得关注——它证明了开源模型在核心智能和实际编码任务上已能媲美顶级闭源方案。
原文
精选全部日报登录