谷歌更新 Android Bench 榜单：Gemini 3.5 Flash 成本最贵，约 DeepSeek V4 Flash 的 17.5 倍

精选理由

谷歌新榜单实测，Gemini 3.5 Flash 在安卓开发任务中得分低、成本高，性价比远不如 DeepSeek V4 Flash。

AI 摘要

谷歌 6 月 15 日更新 Android Bench 榜单，测评 AI 模型在安卓开发任务中的表现。OpenAI 的 GPT-5.5 以 74 分排名第一，GPT-5.4 以 72.4 分第二，谷歌 Gemini 3.1 Pro Preview 同分第三。谷歌自家 Gemini 3.5 Flash 仅得 63.7 分，排第六，且单次运行平均成本 147.1 美元，为榜单最贵。DeepSeek V4 Flash 得分 52.7 排第 12，成本仅 8.4 美元，Gemini 3.5 Flash 成本是其 17.5 倍。

AI 翻译 · 中文

IT之家IT之家 6 月 16 日消息，谷歌昨日（6 月 15 日）更新其 Android Bench 榜单，自家 Gemini 3.5 Flash 模型成绩明显低于外界预期。 IT之家注：Android Bench 是谷歌官方推出的安卓开发任务基准测试，用来评估不同 AI 模型在代码编写、问题解决与开发辅助方面的实际能力。该测试更贴近真实开发场景，专门衡量 AI 模型完成安卓开发任务的能力，因此对开发者选择模型有较强参考价值。根据谷歌…

elvis06-16 19:32原文
OpenAI06-17 20:41原文
Geek06-15 06:31原文
arXiv: Anthropic06-15 10:37原文
berryxia06-16 04:42原文
Decoder06-16 11:28原文
Gary Marcus06-16 18:27原文
@koltregaskes06-16 19:35原文
Jim Fan06-16 21:51原文
Fireworks AI06-16 22:11原文

阅读原文