AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个术语
PCIe 带宽
通过PCIe总线可传输的最大数据速率,对于AI工作负载中CPU和GPU之间的通信速度至关重要。
个术语
NVMe over Fabrics
通过网络访问NVMe存储的协议,减少AI中大数据集的延迟。
个术语
GPUDirect 存储
NVIDIA技术,允许数据直接从存储传输到GPU内存,绕过CPU和RAM。
个术语
内存固定
将内存页面锁定在RAM中的过程,以确保GPU能够持续快速地进行DMA(直接内存访问)。
个术语
零拷贝
一种优化技术,数据直接在设备之间传输,无需在CPU内存中进行中间复制。
个术语
张量核心吞吐量
GPU张量核心的计算能力,通常受限于从内存中获取数据的速度。
个术语
数据流水线并行
一种策略,其中数据加载、预处理和传输与GPU计算并行执行,以掩盖延迟。
个术语
预取
在计算需要之前将数据预先加载到GPU内存中,以保持GPU处于忙碌状态。
个术语
主机到设备延迟
从CPU(主机)启动并完成到GPU(设备)的数据传输所需的时间。
个术语
CUDA流
在GPU上按特定顺序执行的操作序列,允许传输和计算并发进行。
个术语
NUMA感知
优化内存分配以适配多CPU服务器的NUMA拓扑结构,减少访问延迟。
个术语
GPUDirect RDMA
通过RDMA在不同节点间直接传输GPU内存数据的技术,无需CPU拷贝。
个术语
异步数据传输
与GPU计算并行执行的数据传输,使用CUDA流来隐藏延迟。
个术语
页锁定内存
不可分页的系统内存,用于实现到GPU的高速异步DMA传输。
🔍