AI 詞彙表
人工智能完整詞典
GPU直通
允许虚拟机直接且独占访问物理GPU硬件而无需中间虚拟化层的技术。这种方法提供原生性能但限制了GPU在多个虚拟机之间的共享。
虚拟GPU (vGPU)
将物理GPU划分为多个虚拟实例并在不同虚拟机或容器之间共享的虚拟化技术。每个vGPU作为具有自己分配资源的独立GPU运行。
多实例GPU (MIG)
NVIDIA架构,允许将安培GPU划分为多个具有专用资源(计算、内存、缓存)的隔离实例。MIG确保实例间的严格隔离以保证服务质量。
时间分片共享
通过时间片让多个用户交替访问GPU的共享方法。这种方法最大化利用率但可能根据负载引入可变延迟。
CUDA虚拟化
CUDA API的特定虚拟化,允许GPU应用程序在虚拟化环境中以优化性能运行。包括拦截并将CUDA调用路由到适当的GPU资源。
API转发
拦截来自虚拟机的图形或计算API调用并将其重定向到主机物理GPU的机制。允许与现有应用程序兼容而无需修改代码。
基于配置文件的分配
基于预定义资源配置文件(内存、计算、带宽)的GPU分配策略。允许精确调整GPU资源以适应不同工作负载的特定需求。
GPU分区
将GPU资源逻辑或物理划分为可分配给不同应用程序或虚拟机的较小段的过程。包括内存分区、计算单元和内存控制器分区。
Mediated Passthrough
介于直通和完全虚拟化之间的混合模式,通过最少的中间层提供近乎原生的GPU访问。结合了最佳性能与更好的资源管理和隔离。
GPU Scheduler
管理多个并发请求之间GPU资源调度和分配的组件。在遵守优先级和服务质量约束的同时优化GPU利用率。
Direct GPU Access
允许虚拟化应用程序直接访问GPU资源而无需经过软件仿真层的架构。减少延迟并最大化计算性能。
Virtual GPU Manager
集中管理软件,管理vGPU实例的生命周期、分配和监控。根据管理员定义的策略协调可用GPU资源。
GPU Memory Virtualization
抽象物理GPU内存的技术,允许多个虚拟机共享VRAM同时保持专用内存的假象。包括分页、动态分配和内存隔离。
SR-IOV for GPUs
将单根I/O虚拟化标准适配于GPU,允许创建具有直接硬件访问路径的虚拟功能。提供接近裸机性能的隔离和性能。
GPU Containerization
将GPU资源集成到轻量级容器中,隔离驱动程序和CUDA库。与虚拟机相比,能够以最小开销快速部署GPU应用程序。
Remote GPU Virtualization
允许通过网络访问远程GPU资源就像本地资源一样的架构。使用优化协议来最小化延迟并保持计算性能。
动态GPU分配
根据应用程序的即时需求动态分配和释放GPU资源的能力。通过实时调整资源配额来优化GPU利用率。
GPU池化
将多个物理GPU聚合为一个统一的资源池,可按需分配。实现数据中心级别的GPU计算资源负载均衡和弹性扩展。