🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接

AI 词汇表

人工智能完整词典

200
个类别
2,608
个子类别
30,011
个术语
📖
个术语

PCIe 带宽

通过PCIe总线可传输的最大数据速率,对于AI工作负载中CPU和GPU之间的通信速度至关重要。

📖
个术语

NVMe over Fabrics

通过网络访问NVMe存储的协议,减少AI中大数据集的延迟。

📖
个术语

GPUDirect 存储

NVIDIA技术,允许数据直接从存储传输到GPU内存,绕过CPU和RAM。

📖
个术语

内存固定

将内存页面锁定在RAM中的过程,以确保GPU能够持续快速地进行DMA(直接内存访问)。

📖
个术语

零拷贝

一种优化技术,数据直接在设备之间传输,无需在CPU内存中进行中间复制。

📖
个术语

张量核心吞吐量

GPU张量核心的计算能力,通常受限于从内存中获取数据的速度。

📖
个术语

数据流水线并行

一种策略,其中数据加载、预处理和传输与GPU计算并行执行,以掩盖延迟。

📖
个术语

预取

在计算需要之前将数据预先加载到GPU内存中,以保持GPU处于忙碌状态。

📖
个术语

主机到设备延迟

从CPU(主机)启动并完成到GPU(设备)的数据传输所需的时间。

📖
个术语

CUDA流

在GPU上按特定顺序执行的操作序列,允许传输和计算并发进行。

📖
个术语

NUMA感知

优化内存分配以适配多CPU服务器的NUMA拓扑结构,减少访问延迟。

📖
个术语

GPUDirect RDMA

通过RDMA在不同节点间直接传输GPU内存数据的技术,无需CPU拷贝。

📖
个术语

异步数据传输

与GPU计算并行执行的数据传输,使用CUDA流来隐藏延迟。

📖
个术语

页锁定内存

不可分页的系统内存,用于实现到GPU的高速异步DMA传输。

🔍

未找到结果