RDMA - inline 内联提高小包性能-降低时延(减少两个 PCIe 往返延迟)

2024年6月16日

| stor rdma network

RDMA - inline 内联提高小包性能-降低时延(减少两个 PCIe 往返延迟) 背景知识 - IB与PCIE是如何工作的? 摘要这篇文章描述了通过 PCI Express 结构在 CPU 和 NIC 之间发生的一系列协调事件，以通过 InfiniBand 互连传输消息并发出其完成信号。通过 InfiniBand 发送消息的主要方法是通过 Verbs API。libibverbs 是此 API 的标准实现，由 Linux-RDMA 社区……

阅读全文

RDMA - ODP按需分页设计原理-优点-源码浅析

2024年6月15日

| net rdma 网络

RDMA - ODP按需分页设计原理-优点-源码浅析术语 ODP: 按需分页 HMM: 异构内存管理(Heterogeneous Memory Management) 显示/隐式ODP 显式 ODP在显式 ODP 中，应用程序仍注册内存缓冲区以进行通信，但此操作用于定义 IO 的访问控制，而不是固定页面。ODP 内存区域 (MR) 在注册时不需要具有有效的映射。(IBV_E……

阅读全文

Nvidia 迈络思 OFED GPU直接RDMA

2024年1月6日

| stor 存储 gpu rdma

Nvidia 迈络思 OFED GPU直接RDMA 简介 GPU-GPU 间通信的最新进展是 GPUDirect RDMA。该技术在 GPU 内存与 NVIDIA 网络适配器设备之间提供直接的 P2P（点对点）数据路径。这显着减少了 GPU-GPU 通信延迟，并完全卸载了 CPU，将其从网络上的所有 GPU-GPU 通信中移除。GPU Direct 利用 NVIDIA 网络适配器的 PeerDirect RDMA 和 PeerDirect ASYNC™ 功能(异步远端直接通信……

阅读全文

优化 RDMA 代码的建议和技巧-rdma性能优化技巧-避坑指南

2023年12月19日

| stor 存储 rdma

优化 RDMA 代码的建议和技巧-rdma性能优化技巧-避坑指南-RDMA资源 RDMA 被用在很多地方，主要是因为它可以实现高性能。在这篇文章中，我将提供有关如何从多个方面优化 RDMA 代码的建议和技巧简单的科普下RDMA 什么是RDMA？ DMA 代表直接内存访问。这意味着应用程序可以在 CPU 干预的情况下直接访问（读……

阅读全文

DAOS Mercury(HG) Libfabric(OFI) RDMA 分层verbs接口调用详解

2023年10月5日

| stor 存储网络 rdma

DAOS Mercury(HG) Libfabric(OFI) RDMA 分层verbs接口调用详解简介参考之前的分享中, DAOS与RDMA分层关系如下图, DAOS引擎 -> CART(RPC/大块数据/集合RPC请求) -> Mercury(HG: RPC注册/回调/RPC操作/预期/非预期消息/大块消息/轮训/阻塞/网络抽象等) -> Libfabric(网络抽象层,对rxm,r……

阅读全文

英特尔开放结构接口Libfabric教程 rdma verbs network gpu panda

2023年9月24日

| stor 存储 rdma ofa network

Intel Open Fabrics Interfaces Libfabric Tutorial 英特尔开放结构接口 Libfabric 教程 rdma verbs network gpu panda hpc ai 简介本文介绍了libfabric的基本教程, 以及常见代码示例, 包含tcp_socket, libfabric, gpu, dma等代码和示例, 内容基于intel专家的的视频和个人理解, 欢迎一起交流高性能存储, 分布式存储, 网络, rdma等技术 HOTI 热门互联网络技术视……

阅读全文

OpenFabrics 接口简介-用于最大限度提高-高性能应用程序效率的新网络接口(API)

2023年9月17日

| stor 存储 libfabric 网络 rdma

OpenFabrics 接口简介-用于最大限度提高-高性能应用程序效率的新网络接口(API)-[译] 2015 IEEE 第 23 届高性能互连年度研讨会摘要 OpenFabrics Interfaces (OFI) 是一个新的应用程序接口系列，它向中间件和应用程序公开通信服务。 Libfabric 是 OFI 的第一个成员，是在 OpenFabrics 联盟的支持下，由行业、学术界和国家实验室合作伙伴组成的广泛联盟在过去两年中……

阅读全文

Nvidia_Mellanox_CX5和6DX系列网卡_RDMA_RoCE_无损和有损_DCQCN拥塞控制等技术简介

2023年7月23日

| stor 存储 roce rdma

Nvidia_Mellanox_CX5和6DX系列网卡_RDMA_RoCE_无损和有损_DCQCN拥塞控制等技术简介-一文入门RDMA和RoCE有损无损简介随着互联网, 人工智能等兴起, 跨机通信对带宽和时延都提出了更高的要求, RDMA技术也不断迭代演进, 如: RoCE(RDMA融合以……

阅读全文

NVMe-oF,nvme_cli_initiator与tgt(spdk_tgt)之Fabrics(RDMA)流程源码分析

2023年7月14日

| stor 存储 nvmeof rdma

NVMe-oF,nvme_cli_initiator与tgt(spdk_tgt)之Fabrics(RDMA)流程源码分析简介 NVMe over Fabrics (NVMe-oF) 是 NVMe 网络协议对以太网和光纤通道的扩展，可在存储和服务器之间提供更快、更高效的连接，并降低应用程序主机服务器的 CPU 利用率 NVM Express over Fabrics 定义了一个通用架构，支持……

阅读全文

OFA(开放Fabric联盟) - 利用最小CPU开销,为上层应用提供超高性能(线速),超低时延,最大带宽的开放组织

2023年5月1日

| stor 存储 rdma ofa

Author 晓兵 weixin: ssbandjl 公众号: 云原生云 OFA(开放Fabric联盟) - 利用最小CPU开销,为上层应用提供超高性能(线速),超低时延,最大带宽的开放组织成员企业 OFA概览 OpenFabrics Alliance (OFA) 是一个基于开源的组织，负责开发、测试、许可、支持和分发 RDMA/Advanced Networks 软件以及 RDMA/Advanced Networks 软件的 OpenFabrics Enterprise Distribution。该联盟的使命……

阅读全文

分类 rdma 中的文章

RDMA - inline 内联提高小包性能-降低时延(减少两个 PCIe 往返延迟)

RDMA - ODP按需分页设计原理-优点-源码浅析

Nvidia 迈络思 OFED GPU直接RDMA

优化 RDMA 代码的建议和技巧-rdma性能优化技巧-避坑指南

DAOS Mercury(HG) Libfabric(OFI) RDMA 分层verbs接口调用详解

英特尔开放结构接口Libfabric教程 rdma verbs network gpu panda

OpenFabrics 接口简介-用于最大限度提高-高性能应用程序效率的新网络接口(API)

Nvidia_Mellanox_CX5和6DX系列网卡_RDMA_RoCE_无损和有损_DCQCN拥塞控制等技术简介

NVMe-oF,nvme_cli_initiator与tgt(spdk_tgt)之Fabrics(RDMA)流程源码分析

OFA(开放Fabric联盟) - 利用最小CPU开销,为上层应用提供超高性能(线速),超低时延,最大带宽的开放组织

最近文章

分类

标签

友情链接

其它