Claude Opus 4.8 通过 200+ 前端测试，与 Gemini 3.1 Pro 等模型对比

精选理由

前端开发者可以直观看到 Claude Opus 4.8 在复杂 UI 和游戏生成上的实际表现，对比多个主流模型后能更精准选型，值得点开线程看具体案例。

AI 摘要

Arena 的 AI 能力负责人 @petergostev 对 Anthropic 最新发布的 Claude Opus 4.8 进行了超过 200 项 Code Arena 前端测试，涵盖思考与非思考模式，并与过去的 Opus 变体、Gemini 3.1 Pro、3.5 Flash 和 GLM 5.1 进行对比。测试内容包括 3D 场景生成、游戏开发和前端 UI 设计等多个维度。结果已发布在 Arena 的线程中，供开发者参考和讨论。

AI 翻译 · 中文

lmarena.aiArena's AI Capability Lead @petergostev runs @AnthropicAI 's latest Claude Opus 4.8 through 200+ Code Arena: Frontend tests. Both thinking and non-thinking, head-to-head with past Opus variants, Gemini 3.1 Pro, 3…

Decoder05-28 21:20原文
shao__meng05-29 00:55原文
Claude05-28 16:57原文
Alex Albert05-28 16:59原文
Mike Krieger05-28 17:10原文
Jerry Liu05-28 17:17原文
GitHub05-28 17:27原文
宝玉05-28 17:30原文
AI SDK05-28 17:40原文
rohanpaul_ai05-28 18:08原文

查看原推