02:59marktechpost@Asif Razzaq精选Google DeepMind 推出 Gemma 4 的 QAT(量化感知训练)检查点,包含 Q4_0 格式(4-bit 量化)和新开发的移动格式。与 BF16 版本相比,Q4_0 可将模型内存占用降低约 75%,而移动格式进一步优化至适合手机等设备。这些检查点面向边缘计算场景,平衡了精度和推理速度。AI模型Gemma 4Google DeepMindQAT量化模型移动端10 个信源在谈推荐理由:Gemma 4 量化版来了,内存省 75%原文