分类 rdma 中的文章

RDMA - inline 内联提高小包性能-降低时延(减少两个 PCIe 往返延迟)

RDMA - inline 内联提高小包性能-降低时延(减少两个 PCIe 往返延迟) 背景知识 - IB与PCIE是如何工作的? 摘要 这篇文章描述了通过 PCI Express 结构在 CPU 和 NIC 之间发生的一系列协调事件,以通过 InfiniBand 互连传输消息并发出其完成信号。 通过 InfiniBand 发送消息的主要方法是通过 Verbs API。libibverbs 是此 API 的标准实现,由 Linux-RDMA 社区……

阅读全文

RDMA - ODP按需分页设计原理-优点-源码浅析

RDMA - ODP按需分页设计原理-优点-源码浅析 术语 ODP: 按需分页 HMM: 异构内存管理(Heterogeneous Memory Management) 显示/隐式ODP 显式 ODP在显式 ODP 中,应用程序仍注册内存缓冲区以进行通信,但此操作用于定义 IO 的访问控制,而不是固定页面。ODP 内存区域 (MR) 在注册时不需要具有有效的映射。(IBV_E……

阅读全文

Nvidia 迈络思 OFED GPU直接RDMA

Nvidia 迈络思 OFED GPU直接RDMA 简介 GPU-GPU 间通信的最新进展是 GPUDirect RDMA。该技术在 GPU 内存与 NVIDIA 网络适配器设备之间提供直接的 P2P(点对点)数据路径。这显着减少了 GPU-GPU 通信延迟,并完全卸载了 CPU,将其从网络上的所有 GPU-GPU 通信中移除。GPU Direct 利用 NVIDIA 网络适配器的 PeerDirect RDMA 和 PeerDirect ASYNC™ 功能(异步远端直接通信……

阅读全文

优化 RDMA 代码的建议和技巧-rdma性能优化技巧-避坑指南

优化 RDMA 代码的建议和技巧-rdma性能优化技巧-避坑指南-RDMA资源 RDMA 被用在很多地方,主要是因为它可以实现高性能。在这篇文章中,我将提供有关如何从多个方面优化 RDMA 代码的建议和技巧 简单的科普下RDMA 什么是RDMA? DMA 代表直接内存访问。这意味着应用程序可以在 CPU 干预的情况下直接访问(读……

阅读全文

英特尔开放结构接口Libfabric教程 rdma verbs network gpu panda

Intel Open Fabrics Interfaces Libfabric Tutorial 英特尔开放结构接口 Libfabric 教程 rdma verbs network gpu panda hpc ai 简介 本文介绍了libfabric的基本教程, 以及常见代码示例, 包含tcp_socket, libfabric, gpu, dma等代码和示例, 内容基于intel专家的的视频和个人理解, 欢迎一起交流高性能存储, 分布式存储, 网络, rdma等技术 HOTI 热门互联网络技术 视……

阅读全文

OpenFabrics 接口简介-用于最大限度提高-高性能应用程序效率的新网络接口(API)

OpenFabrics 接口简介-用于最大限度提高-高性能应用程序效率的新网络接口(API)-[译] 2015 IEEE 第 23 届高性能互连年度研讨会 摘要 OpenFabrics Interfaces (OFI) 是一个新的应用程序接口系列,它向中间件和应用程序公开通信服务。 Libfabric 是 OFI 的第一个成员,是在 OpenFabrics 联盟的支持下,由行业、学术界和国家实验室合作伙伴组成的广泛联盟在过去两年中……

阅读全文

OFA(开放Fabric联盟) - 利用最小CPU开销,为上层应用提供超高性能(线速),超低时延,最大带宽的开放组织

Author 晓兵 weixin: ssbandjl 公众号: 云原生云 OFA(开放Fabric联盟) - 利用最小CPU开销,为上层应用提供超高性能(线速),超低时延,最大带宽的开放组织 成员企业 OFA概览 OpenFabrics Alliance (OFA) 是一个基于开源的组织,负责开发、测试、许可、支持和分发 RDMA/Advanced Networks 软件以及 RDMA/Advanced Networks 软件的 OpenFabrics Enterprise Distribution。该联盟的使命……

阅读全文