精选理由
AWS 用 RNG 解决了胖树网络的流量瓶颈,做 AI 训练和大规模云计算的团队可以直接受益——更少的硬件、更低的成本、更好的吞吐,值得点开了解工程细节。
Amazon 发布了新型数据中心网络架构“Resilient Network Graphs”(RNG),用扁平随机图替代传统的胖树结构,将硬件需求降低 69%,吞吐量提升 33%。该设计自去年起已在 AWS 数据中心悄然部署,现已成为大多数 AWS 工作负载的默认网络。RNG 通过扁平化随机图连接路由器,提供多条独立路径,避免胖树网络的流量瓶颈问题。其路由系统 Spraypoint 将流量分散到多条路径,ShuffleBox 布线设备使随机连接变得可实施。实测显示,RNG 在性能上与胖树网络持平,但成本降低 9% 至 45%,尤其对 AI 集群的大规模同步训练流量有显著改善。
AI 翻译 · 中文
Amazon 发布了新型数据中心网络架构“Resilient Network Graphs”(RNG),用扁平随机图替代传统的胖树结构,将硬件需求降低 69%,吞吐量提升 33%。该设计自去年起已在 AWS 数据中心悄然部署,现已成为大多数 AWS 工作负载的默认网络。RNG 通过扁平化随机图连接路由器,提供多条独立路径,避免胖树网络的流量瓶颈问题。其路由系统 Spraypoint 将流量分散到多条路径,ShuffleBox 布线设备使随机连接变得可实施。实测显示,RNG 在性能上与胖树网络持平,但成本降低 9% 至 45%,尤其对 AI 集群的大规模同步训练流量有显著改善。
Amazon unveiled “Resilient Network Graphs,” (RNG) a data center network that reduces hardware needs by 69% and raises throughput by 33%. It is now default for most AWS workloads. They revealed that it has been quietly de…