16:55Geek@geekbb精选NVIDIA 基于智谱 GLM-5.2 模型量化出 NVFP4 精度版本,命名为 nvidia/GLM-5.2-NVFP4。该模型通过 Hugging Face 免费层级 API 提供,限制为每小时 300 次或每天 1,000 次请求。作者认为其性能至少应优于 deepseek-v4-flash。AI模型nvidia/GLM-5.2-NVFP4智谱NVIDIAHugging Face推理模型4 个信源在谈推荐理由:NVIDIA 把智谱的 GLM-5.2 量化成 NVFP4 精度,放 Hugging Face 上免费调,还能白嫖,日常推理够用了。原文