mKernel：多GPU多节点融合内核库，用于GPU驱动通信

精选理由

UC Berkeley的GPU通信新库

AI 摘要

UC Berkeley的UCCL团队发布mKernel，这是一个将节点内NVLink、节点间RDMA和密集计算融合成单个持久CUDA内核的库。它旨在提升多GPU多节点环境下的通信效率。通过消除内核启动和内存拷贝开销，mKernel在典型训练工作负载中可显著降低延迟。该库开源，支持NVIDIA GPU集群。

mKernel：多GPU多节点融合内核库，用于GPU驱动通信 — 图片来源 · marktechpost

AI 翻译 · 中文

marktechpostUC Berkeley's UCCL team releases mKernel, fusing intra-node NVLink, inter-node RDMA, and dense compute into a single persistent CUDA kernel. The post Meet mKernel: A Multi-GPU, Multi-Node Fused Kernel Library for GPU-Dri…

IT之家05-29 07:52原文
Together AI05-29 20:17原文
LangChain05-27 18:02原文
NVIDIA AI05-27 23:56原文
rohanpaul_ai05-28 12:05原文

阅读原文