13:00@atomic_chat_hq@atomic_chat_hq精选Google Gemma 4 12B模型在RTX 4090上实测仅需9GB VRAM,生成8.9k tokens,速度80 tok/s,性能接近26B版本。其对比的Gemma 4 26B-A4B使用15GB VRAM,生成6.9k tokens,速度138 tok/s,所有场景胜出。但12B在近半VRAM下表现十分接近,成为16GB笔记本的理想选择。AI模型Gemma 412B26B-A4BGoogle推理模型4 个信源在谈推荐理由:新Gemma 4 12B别看参数小,实测代码能力接近26B版,而且只需要9GB显存,16GB笔记本就能跑。原文
06:06Sundar Pichai@sundarpichai88°Google CEO Sundar Pichai 宣布推出 Gemma 4 12B 模型,该模型在体积和性能之间取得平衡,可在配备 16GB VRAM 的笔记本电脑上本地运行。它支持多步推理和智能体工作流,采用 Apache 2.0 开源许可。同时,Gemma 4 系列下载量已超过 1.5 亿次。该模型为开发者提供了在本地设备上部署强大 AI 能力的新选择。AI模型Gemma 412B本地运行开源推理模型10 个信源在谈推荐理由:对于想在笔记本上跑本地 AI 的开发者,Gemma 4 12B 是难得的小体积高性能选择,16GB VRAM 就能运行,建议直接下载试试。原文