数据传传输优化 - AI 术语表

📖

个术语

PCIe 带宽

通过PCIe总线可传输的最大数据速率，对于AI工作负载中CPU和GPU之间的通信速度至关重要。

📖

个术语

NVMe over Fabrics

通过网络访问NVMe存储的协议，减少AI中大数据集的延迟。

📖

个术语

GPUDirect 存储

NVIDIA技术，允许数据直接从存储传输到GPU内存，绕过CPU和RAM。

📖

个术语

内存固定

将内存页面锁定在RAM中的过程，以确保GPU能够持续快速地进行DMA（直接内存访问）。

📖

个术语

零拷贝

一种优化技术，数据直接在设备之间传输，无需在CPU内存中进行中间复制。

📖

个术语

张量核心吞吐量

GPU张量核心的计算能力，通常受限于从内存中获取数据的速度。

📖

个术语

数据流水线并行

一种策略，其中数据加载、预处理和传输与GPU计算并行执行，以掩盖延迟。

📖

个术语

预取

在计算需要之前将数据预先加载到GPU内存中，以保持GPU处于忙碌状态。

📖

个术语

主机到设备延迟

从CPU（主机）启动并完成到GPU（设备）的数据传输所需的时间。

📖

个术语

CUDA流

在GPU上按特定顺序执行的操作序列，允许传输和计算并发进行。

📖

个术语

NUMA感知

优化内存分配以适配多CPU服务器的NUMA拓扑结构，减少访问延迟。

📖

个术语

GPUDirect RDMA

通过RDMA在不同节点间直接传输GPU内存数据的技术，无需CPU拷贝。

📖

个术语

异步数据传输

与GPU计算并行执行的数据传输，使用CUDA流来隐藏延迟。

📖

个术语

页锁定内存

不可分页的系统内存，用于实现到GPU的高速异步DMA传输。

AI 词汇表