论文精选

GASLoC:统一本地通信与本地更新的LLM预训练新算法

Unifying Local Communications and Local Updates for LLM Pretraining

精选理由

GASLoC解决了分布式LLM训练中通信效率与异构带宽的痛点,做大规模模型预训练的团队可以直接参考实验对比,看看能否替代现有方案。

AI 摘要

GASLoC是一种新型去中心化预训练算法,旨在解决LLM训练中通信效率低下的问题。传统方法依赖同步All-Reduce操作,在带宽或工作速度不均时成为瓶颈。GASLoC通过将通信加速泛化到“外部优化器”,实现了兼容自适应优化器、支持本地优化步骤和稀疏随机通信的实用gossip训练框架。实验表明,在单步通信设置下,GASLoC在多种拓扑结构中优于现有去中心化算法;在多步本地更新时,性能与DiLoCo相当,且在异构带宽场景下显著超越DiLoCo。

AI 翻译 · 中文

GASLoC是一种新型去中心化预训练算法,旨在解决LLM训练中通信效率低下的问题。传统方法依赖同步All-Reduce操作,在带宽或工作速度不均时成为瓶颈。GASLoC通过将通信加速泛化到“外部优化器”,实现了兼容自适应优化器、支持本地优化步骤和稀疏随机通信的实用gossip训练框架。实验表明,在单步通信设置下,GASLoC在多种拓扑结构中优于现有去中心化算法;在多步本地更新时,性能与DiLoCo相当,且在异构带宽场景下显著超越DiLoCo。

arXiv cs.AICommunication-efficient pre-training of LLMs is increasingly important as training draws on compute distributed across clusters, data centers, and lower-bandwidth links. Many practical methods reduce communication freque