NVIDIA AI@NVIDIAAI70NVIDIA AI与SakanaAI Labs合作发表ICML 2026论文,提出专为现代NVIDIA GPU优化的稀疏Transformer内核与格式。核心技术包括TwELL稀疏打包和融合CUDA内核,在大规模训练和推理场景中实现20%以上的加速。论文与代码已公开。论文稀疏计算GPU优化TransformerNVIDIASakanaAI推荐理由:该工作展示了硬件厂商与AI研究机构在底层算子优化上的高效协作,直接提升了大模型训练/推理效率,对部署大规模Transformer模型的企业而言有显著成本降低潜力。