AI模型精选

NVIDIA 发布 nvidia/GLM-5.2-NVFP4 量化模型,可经 Hugging Face 调用

通过 Hugging Face 用上了 nvidia/GLM-5.2-NVFP4,这是 NVIDIA 基于智谱 GLM-5.2 模型量化而来的 NVFP4 精度版本。我在想它至少应该比 deepsee...

精选理由

NVIDIA 把智谱的 GLM-5.2 量化成 NVFP4 精度,放 Hugging Face 上免费调,还能白嫖,日常推理够用了。

AI 摘要

NVIDIA 基于智谱 GLM-5.2 模型量化出 NVFP4 精度版本,命名为 nvidia/GLM-5.2-NVFP4。该模型通过 Hugging Face 免费层级 API 提供,限制为每小时 300 次或每天 1,000 次请求。作者认为其性能至少应优于 deepseek-v4-flash。

AI 翻译 · 中文

NVIDIA 基于智谱 GLM-5.2 模型量化出 NVFP4 精度版本,命名为 nvidia/GLM-5.2-NVFP4。该模型通过 Hugging Face 免费层级 API 提供,限制为每小时 300 次或每天 1,000 次请求。作者认为其性能至少应优于 deepseek-v4-flash。

Geek通过 Hugging Face 用上了 nvidia/GLM-5.2-NVFP4,这是 NVIDIA 基于智谱 GLM-5.2 模型量化而来的 NVFP4 精度版本。我在想它至少应该比 deepseek-v4-flash 更强吧。 Hugging Face 免费层级 API 调用的限制我记不太清了,好像是每小时 300 次或每天 1,000 次请求。 💬 2 🔄 0 ❤️ 5 👀 1615 📊 4 ⚡ Powered by xg