包含标签 rdma 的文章

RDMA - inline 内联提高小包性能-降低时延(减少两个 PCIe 往返延迟)

RDMA - inline 内联提高小包性能-降低时延(减少两个 PCIe 往返延迟) 背景知识 - IB与PCIE是如何工作的? 摘要 这篇文章描述了通过 PCI Express 结构在 CPU 和 NIC 之间发生的一系列协调事件,以通过 InfiniBand 互连传输消息并发出其完成信号。 通过 InfiniBand 发送消息的主要方法是通过 Verbs API。libibverbs 是此 API 的标准实现,由 Linux-RDMA 社区……

阅读全文

RDMA - ODP按需分页设计原理-优点-源码浅析

RDMA - ODP按需分页设计原理-优点-源码浅析 术语 ODP: 按需分页 HMM: 异构内存管理(Heterogeneous Memory Management) 显示/隐式ODP 显式 ODP在显式 ODP 中,应用程序仍注册内存缓冲区以进行通信,但此操作用于定义 IO 的访问控制,而不是固定页面。ODP 内存区域 (MR) 在注册时不需要具有有效的映射。(IBV_E……

阅读全文

Nvidia 迈络思 OFED GPU直接RDMA

Nvidia 迈络思 OFED GPU直接RDMA 简介 GPU-GPU 间通信的最新进展是 GPUDirect RDMA。该技术在 GPU 内存与 NVIDIA 网络适配器设备之间提供直接的 P2P(点对点)数据路径。这显着减少了 GPU-GPU 通信延迟,并完全卸载了 CPU,将其从网络上的所有 GPU-GPU 通信中移除。GPU Direct 利用 NVIDIA 网络适配器的 PeerDirect RDMA 和 PeerDirect ASYNC™ 功能(异步远端直接通信……

阅读全文

优化 RDMA 代码的建议和技巧-rdma性能优化技巧-避坑指南

优化 RDMA 代码的建议和技巧-rdma性能优化技巧-避坑指南-RDMA资源 RDMA 被用在很多地方,主要是因为它可以实现高性能。在这篇文章中,我将提供有关如何从多个方面优化 RDMA 代码的建议和技巧 简单的科普下RDMA 什么是RDMA? DMA 代表直接内存访问。这意味着应用程序可以在 CPU 干预的情况下直接访问(读……

阅读全文

OpenFabrics 接口简介-用于最大限度提高-高性能应用程序效率的新网络接口(API)

OpenFabrics 接口简介-用于最大限度提高-高性能应用程序效率的新网络接口(API)-[译] 2015 IEEE 第 23 届高性能互连年度研讨会 摘要 OpenFabrics Interfaces (OFI) 是一个新的应用程序接口系列,它向中间件和应用程序公开通信服务。 Libfabric 是 OFI 的第一个成员,是在 OpenFabrics 联盟的支持下,由行业、学术界和国家实验室合作伙伴组成的广泛联盟在过去两年中……

阅读全文

OFA(开放Fabric联盟) - 利用最小CPU开销,为上层应用提供超高性能(线速),超低时延,最大带宽的开放组织

Author 晓兵 weixin: ssbandjl 公众号: 云原生云 OFA(开放Fabric联盟) - 利用最小CPU开销,为上层应用提供超高性能(线速),超低时延,最大带宽的开放组织 成员企业 OFA概览 OpenFabrics Alliance (OFA) 是一个基于开源的组织,负责开发、测试、许可、支持和分发 RDMA/Advanced Networks 软件以及 RDMA/Advanced Networks 软件的 OpenFabrics Enterprise Distribution。该联盟的使命……

阅读全文

利用 RDMA 技术加速 Ceph 存储解决方案

Author 晓兵 weixin: ssbandjl 公众号: 云原生云 利用 RDMA 技术加速 Ceph 存储解决方案 原创 晓兵XB 云原生云 2023-04-29 20:37 发表于四川 https://mp.weixin.qq.com/s/FCQMaDmumCHw8WElBsD18Q 在本文中,我们首先回顾了 Ceph* 4K I/O 工作负载中遇到的性能挑战,并对单个 Ceph OSD 对象存储守护进程 (OSD) 进程的 CPU 分布进行了简要分析。然后,我们讨论了现有 TCP/IP 堆栈中的低效问题,并介绍了英特尔® 以太网连接 X722 支持的 iWARP……

阅读全文