全部 AI 动态 · AI 热点

6月26日

01:24

01:24

lmarena.ai@lmarena_ai

精选

Zai_org的GLM系列在Code Arena: Frontend基准上持续增长，GLM-4.6得分1408，GLM-5.2 (Max)达到1595，超越Opus 4.8并逼近Claude Fable 5的1665分。GLM-5.2 (Max)是该实验室最强的编码模型，在HTML/React真实任务上缩小了与前沿实验室的差距。该模型为开源发布。

AI模型 GLM Zai_org Code Arena 前端编码开源模型

推荐理由：Zai_org的GLM-5.2开源模型在前端编码上超过了Opus，离领先的Claude Fable只差一点，值得试试

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月15日

18:00

18:00

阿里云 Alibaba Cloud@alibaba_cloud

71°

阿里云推出旗舰模型 Qwen3.7-Max，专为 agentic 工作负载优化。该模型在生成前端代码方面表现出色，能从一条提示生成包含 Three.js 3D 场景和动态 SVG 图形的丰富交互式网页。目前限时提供 50% 折扣。

AI模型 Qwen3.7-Max Alibaba 前端编码智能体编程助手

推荐理由：阿里新模型 Qwen3.7-Max 能一句提示生成前端交互页面，比一般模型更擅长做 Three.js 和 SVG 动画，适合开发者快速试玩。

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月20日

03:53

03:53

lmarena.ai@lmarena_ai

83°

Google DeepMind 的 Gemini 3.5 Flash 模型在 Code Arena 前端评测中取得显著进步，总分 1507，比上一代 Flash 提升 70 分，甚至超越了之前的 Pro 版本。该模型在消费产品、内容创作工具、数据与分析等子类别中全面领先，输出速度达到 Pro 版本的 2 倍以上。目前 Gemini 3.5 Flash 在 Code Arena 前端排名第 9，在 Text Arena 也位列第 9，并在其价格区间内实现了最佳性价比。

AI模型 Gemini 3.5 Flash Google DeepMind 前端编码 Code Arena 性价比

推荐理由：前端开发者做自动化编码任务时，Gemini 3.5 Flash 以更快的速度和更低的成本超越了 Pro 版本，值得在项目中实测对比。

03:51

03:51

lmarena.ai@lmarena_ai

72°

Code Arena: Frontend 是一个新的评测平台，专注于评估 AI 模型在真实用户构建应用和网站（HTML 和 React）时的前端编码能力。该评测强调智能体（Agent）模式下的任务执行，与传统的代码生成评测不同。用户可以通过 arena.ai/leaderboard/co… 查看详细的排行榜和筛选结果。这一评测为开发者提供了更贴近实际开发场景的模型性能参考。

AI产品前端编码智能体评测/排行榜 HTML React

推荐理由：对于前端开发者或使用 AI 编程助手的团队，这个评测能帮你了解哪些模型在实际构建 HTML/React 应用时表现更好，建议关注排行榜以指导工具选型。

02:20

02:20

lmarena.ai@lmarena_ai

76°

Gemini 3.5 Flash 在 Text and Code Arena: Frontend 中排名第9，得分1507，比上一代 Gemini-3 Flash 提升70分。该评测聚焦于真实用户构建应用和网站时的前端编码任务（HTML 和 React）。在子类别中，内容创作工具排名第7，游戏第8，消费产品第8，数据与分析第9，参考设计第10。此外，它在 Text Arena 中整体排名第9，并在其价格区间内实现了最佳 Arena 得分，重新定义了性价比边界。Google DeepMind 团队发布了这一新模型系列，强调其结合前沿智能与真实世界行动能力，特别适合智能体和编码场景。

AI模型 Gemini 3.5 Flash 前端编码智能体性价比 Google DeepMind

推荐理由：Gemini 3.5 Flash 在价格区间内实现了最高 Arena 得分，做前端开发或智能体应用的团队可以直接关注，性价比突出值得一试。