Google 发布 Gemma 4 QAT，内存需求降低 3 倍

精选理由

本地 AI 爱好者终于等到了——Gemma 4 QAT 让旗舰级模型跑在手机和笔记本上，做边缘计算或隐私敏感应用的开发者可以直接试试。

AI 摘要

Google 发布了 Gemma 4 QAT 模型，相比前代内存需求降低 3 倍，使得高性能模型能在本地设备上运行。其中 Gemma 4 E4B 模型性能优于 GPT-4o，仅需 2GB RAM 即可在手机上运行。而 Gemma 4 31B 模型（约 Opus 4 级别）现在可以在笔记本电脑上运行。这标志着本地 AI 部署的重大突破，让更多用户无需依赖云端即可使用强大模型。

AI 翻译 · 中文

Paul CouvertThat's massive for local AI Google has just released Gemma 4 QAT and it runs with 3x less memory! Remember GPT-4o? Gemma 4 E4B is better and can now run on your phone (!!) with just 2GB RAM. And Gemma 4 31B (~ Opus 4…

Google AI Developers06-05 16:57原文
rohanpaul_ai06-06 00:26原文
小互06-04 00:22原文
berryxia06-04 00:22原文
ollama06-05 18:32原文
marktechpost06-05 18:59原文
Sundar Pichai06-03 19:36原文
Decoder06-03 19:54原文
Philipp Schmid06-04 14:47原文
AI Breakfast06-05 15:03原文

查看原推