NVIDIA 推出的 NVFP4 是一种 4 位浮点精度格式,旨在在保持模型精度的同时大幅提升推理和训练速度。近期,NVFP4 在多个场景中得到验证,并与其他技术协同发展。
当前焦点在于 NVFP4 的广泛适用性与精度损失争议。NVIDIA 声称零精度损失,但实际应用中需依赖算法(如 ScaleSearch 中的缩放因子搜索)来保障(ScaleSearch:搜索块浮点缩放因子,提升量化精度)。未来值得观察 NVFP4 能否成为低精度训练和推理的标准格式,以及它与 DiffusionGemma 等新型模型架构的兼容性。