Code Arena 是专注于 AI 代码生成能力的评测平台,近期新增前端编码分类,引发新一轮模型能力比拼。其排名显示,Claude 系列仍保持领先:Claude Fable 5 在前端赛道登顶,全面领先 Opus-4.8(来源);Claude Opus 4.8 也在前端测试中表现亮眼(来源)。与此同时,开源模型崛起明显:阿里 Qwen3.7-Max 登顶 Code Arena 前端第4,超越 GLM-5.1,追平 Claude Opus 4.6(来源),并被多家媒体称为全球第二 AI 编程模型(来源),其编程能力超 Claude Opus 4.6 的消息引发关注(来源)。此外,Gemini 3.5 Flash 在前端评测中超越自家 Pro 版本,显示出模型轻量化趋势(来源)。
当前焦点在于前端编码这一细分赛道,它反映了 AI 辅助 Web 开发的实际需求(来源)。值得注意的是,排名变动频繁,模型间的差距逐渐缩小,竞争从单一总分转向场景化能力。未来观察点包括:Claude 系列能否维持领先,阿里 Qwen 等开源模型是否继续突破,以及小模型(如 Gemini Flash)在特定任务上的性价比能否改变主流选择。