Google 发布 Gemma 4 QAT,内存需求降低 3 倍

That's massive for local AI Google has just released Gemma 4 QAT and it runs with 3x less memory! ...

精选理由

本地 AI 爱好者终于等到了——Gemma 4 QAT 让旗舰级模型跑在手机和笔记本上,做边缘计算或隐私敏感应用的开发者可以直接试试。

AI 摘要

Google 发布了 Gemma 4 QAT 模型,相比前代内存需求降低 3 倍,使得高性能模型能在本地设备上运行。其中 Gemma 4 E4B 模型性能优于 GPT-4o,仅需 2GB RAM 即可在手机上运行。而 Gemma 4 31B 模型(约 Opus 4 级别)现在可以在笔记本电脑上运行。这标志着本地 AI 部署的重大突破,让更多用户无需依赖云端即可使用强大模型。

AI 翻译 · 中文

Google 发布了 Gemma 4 QAT 模型,相比前代内存需求降低 3 倍,使得高性能模型能在本地设备上运行。其中 Gemma 4 E4B 模型性能优于 GPT-4o,仅需 2GB RAM 即可在手机上运行。而 Gemma 4 31B 模型(约 Opus 4 级别)现在可以在笔记本电脑上运行。这标志着本地 AI 部署的重大突破,让更多用户无需依赖云端即可使用强大模型。

Paul CouvertThat's massive for local AI Google has just released Gemma 4 QAT and it runs with 3x less memory! Remember GPT-4o? Gemma 4 E4B is better and can now run on your phone (!!) with just 2GB RAM. And Gemma 4 31B (~ Opus 4