Nvidia 迈络思 OFED GPU直接RDMA

简介

image-20240106175123171

GPU-GPU 间通信的最新进展是 GPUDirect RDMA。该技术在 GPU 内存与 NVIDIA 网络适配器设备之间提供直接的 P2P(点对点)数据路径。这显着减少了 GPU-GPU 通信延迟,并完全卸载了 CPU,将其从网络上的所有 GPU-GPU 通信中移除。GPU Direct 利用 NVIDIA 网络适配器的 PeerDirect RDMA 和 PeerDirect ASYNC™ 功能(异步远端直接通信)

该技术的优点

  • 通过直接将数据复制到固定 GPU 内存或从固定 GPU 内存复制数据,避免不必要的系统内存复制和 CPU 开销
  • GPU 设备和基于 NVIDIA RDMA 的网络设备之间的点对点传输
  • 使用高速 DMA 传输在 P2P 设备之间复制数据
  • 使用直接内存访问 (DMA) 消除 CPU 带宽和延迟瓶颈
  • 借助 GPUDirect RDMA,GPU 内存可用于远程直接内存访问 (RDMA),从而提高应用程序的效率
  • 通过零拷贝支持增强消息传递接口 (MPI) 应用程序

参考

Nvidia GPU直接RDMA通信 Home » Products » Adapter IB/VPI SW MLNX_OFED GPUDirect RDMA: https://network.nvidia.com/products/GPUDirect-RDMA/

晓兵

博客: https://logread.cn | https://blog.csdn.net/ssbandjl | https://cloud.tencent.com/developer/user/5060293/articles

weixin: ssbandjl

公众号: 云原生云

云原生云