全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月20日

13:09

13:09

berryxia@berryxia

83°

Google DeepMind 推出了 Gemini 3.5 Flash 模型，在 Intelligence Index 上获得 55 分，比上一代 Gemini 3 Flash 高 9 分，超越 Grok 4.3 和 Claude Sonnet 4.6。Agentic 任务 Elo 评分达 1656，幻觉率从 92% 降至 61%，多模态理解 MMMU-Pro 达 84%，输出速度超 280 tokens/s，比前代快 70%。但成本大幅上升，运行一次测试的成本是 Gemini 3 Flash 的 5.5 倍，定价为 $1.5/$9 per 1M input/output tokens，是前代的 3 倍。这标志着智能与速度的 Pareto 前沿被刷新，但“Flash”系列的性价比优势不再。

AI模型 Gemini 3.5 Flash Google DeepMind 推理模型多模态成本分析

推荐理由：Gemini 3.5 Flash 在智能和速度上实现了突破，做 AI 应用或 agent 开发的团队值得关注——性能提升显著，但预算敏感型项目需要重新评估成本。