NVIDIA 发布 nvidia/GLM-5.2-NVFP4 量化模型，可经 Hugging Face 调用

精选理由

NVIDIA 把智谱的 GLM-5.2 量化成 NVFP4 精度，放 Hugging Face 上免费调，还能白嫖，日常推理够用了。

AI 摘要

NVIDIA 基于智谱 GLM-5.2 模型量化出 NVFP4 精度版本，命名为 nvidia/GLM-5.2-NVFP4。该模型通过 Hugging Face 免费层级 API 提供，限制为每小时 300 次或每天 1,000 次请求。作者认为其性能至少应优于 deepseek-v4-flash。

AI 翻译 · 中文

Geek通过 Hugging Face 用上了 nvidia/GLM-5.2-NVFP4，这是 NVIDIA 基于智谱 GLM-5.2 模型量化而来的 NVFP4 精度版本。我在想它至少应该比 deepseek-v4-flash 更强吧。 Hugging Face 免费层级 API 调用的限制我记不太清了，好像是每小时 300 次或每天 1,000 次请求。 💬 2 🔄 0 ❤️ 5 👀 1615 📊 4 ⚡ Powered by xg…

LMSYS Org (SGLang)06-27 13:12原文
marktechpost06-27 00:02原文
vLLM06-27 05:54原文
NVIDIA AI06-24 16:03原文

查看原推