全部 AI 动态 · AI 热点

6月19日

09:25

09:25

Clement Delangue@ClementDelangue

AA-Briefcase基准测试评估模型在长期知识工作项目中的表现，任务成本差异达800倍。Claude Fable 5以1587 Elo领先，但平均任务成本31美元；Claude Opus 4.8得分1356，成本10.40美元。DeepSeek V4 Flash仅需约0.04美元，性价比最高。GLM-5.2得分1266，成本2.40美元，得分仅低Claude Opus 4.8不到90 Elo，成本不到其25%。

AI模型 Claude Fable 5 DeepSeek V4 Flash GLM-5.2 AA-Briefcase 推理模型

推荐理由：新基准AA-Briefcase测长期项目，Claude Fable 5最强但贵，DeepSeek V4 Flash极便宜，GLM-5.2性价比超赞。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

12:25

12:25IT之家（博客/媒体）

谷歌 6 月 15 日更新 Android Bench 榜单，测评 AI 模型在安卓开发任务中的表现。OpenAI 的 GPT-5.5 以 74 分排名第一，GPT-5.4 以 72.4 分第二，谷歌 Gemini 3.1 Pro Preview 同分第三。谷歌自家 Gemini 3.5 Flash 仅得 63.7 分，排第六，且单次运行平均成本 147.1 美元，为榜单最贵。DeepSeek V4 Flash 得分 52.7 排第 12，成本仅 8.4 美元，Gemini 3.5 Flash 成本是其 17.5 倍。

AI模型 Android Bench Gemini 3.5 Flash GPT-5.5 DeepSeek V4 Flash 开发辅助

推荐理由：谷歌新榜单实测，Gemini 3.5 Flash 在安卓开发任务中得分低、成本高，性价比远不如 DeepSeek V4 Flash。

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月22日

14:00

14:00

OpenRouter@OpenRouterAI

精选

DeepSeek V4 Flash 在 OpenRouter 每周排行榜中登顶，获得 1196 次浏览和 38 个点赞。该模型是 DeepSeek V4 的轻量版本，表现出色。OpenRouter 排行榜基于用户使用量和反馈，V4 Flash 的领先显示了其在开发者中的受欢迎程度。

AI模型 DeepSeek V4 Flash DeepSeek OpenRouter 推理模型

推荐理由：DeepSeek新模型登顶社区排行榜