谷歌更新 Android Bench 榜单:Gemini 3.5 Flash 成本最贵,约 DeepSeek V4 Flash 的 17.5 倍

谷歌更新安卓开发最佳 AI 模型榜单:Gemini 3.5 Flash 成本最贵,约为 DeepSeek V4 Flash 的 17.5 倍

精选理由

谷歌新榜单实测,Gemini 3.5 Flash 在安卓开发任务中得分低、成本高,性价比远不如 DeepSeek V4 Flash。

AI 摘要

谷歌 6 月 15 日更新 Android Bench 榜单,测评 AI 模型在安卓开发任务中的表现。OpenAI 的 GPT-5.5 以 74 分排名第一,GPT-5.4 以 72.4 分第二,谷歌 Gemini 3.1 Pro Preview 同分第三。谷歌自家 Gemini 3.5 Flash 仅得 63.7 分,排第六,且单次运行平均成本 147.1 美元,为榜单最贵。DeepSeek V4 Flash 得分 52.7 排第 12,成本仅 8.4 美元,Gemini 3.5 Flash 成本是其 17.5 倍。

AI 翻译 · 中文

谷歌 6 月 15 日更新 Android Bench 榜单,测评 AI 模型在安卓开发任务中的表现。OpenAI 的 GPT-5.5 以 74 分排名第一,GPT-5.4 以 72.4 分第二,谷歌 Gemini 3.1 Pro Preview 同分第三。谷歌自家 Gemini 3.5 Flash 仅得 63.7 分,排第六,且单次运行平均成本 147.1 美元,为榜单最贵。DeepSeek V4 Flash 得分 52.7 排第 12,成本仅 8.4 美元,Gemini 3.5 Flash 成本是其 17.5 倍。

IT之家IT之家 6 月 16 日消息,谷歌昨日(6 月 15 日)更新其 Android Bench 榜单, 自家 Gemini 3.5 Flash 模型成绩明显低于外界预期。 IT之家注:Android Bench 是谷歌官方推出的安卓开发任务基准测试,用来评估不同 AI 模型在代码编写、问题解决与开发辅助方面的实际能力。 该测试更贴近真实开发场景,专门衡量 AI 模型完成安卓开发任务的能力, 因此对开发者选择模型有较强参考价值。 根据谷歌