Virtualização de GPU - Glossário IA

📖

termos

GPU Passthrough

Técnica que permite a uma máquina virtual aceder direta e exclusivamente ao hardware físico da GPU sem uma camada de virtualização intermédia. Esta abordagem oferece desempenho nativo, mas limita a partilha da GPU entre várias VMs.

📖

termos

GPU Virtual (vGPU)

Tecnologia de virtualização que divide uma GPU física em várias instâncias virtuais partilhadas entre diferentes máquinas virtuais ou contentores. Cada vGPU funciona como uma GPU independente com os seus próprios recursos alocados.

📖

termos

GPU Multi-Instância (MIG)

Arquitetura NVIDIA que permite particionar uma GPU Ampere em várias instâncias isoladas com recursos dedicados (computação, memória, cache). O MIG garante um isolamento rigoroso entre as instâncias para assegurar a qualidade de serviço.

📖

termos

Partilha por Fatias de Tempo

Método de partilha de GPU onde vários utilizadores alternam o acesso à GPU por fatias de tempo (time slices). Esta abordagem maximiza a utilização, mas pode introduzir uma latência variável dependendo da carga.

📖

termos

Virtualização CUDA

Virtualização específica da API CUDA que permite que as aplicações de GPU sejam executadas em ambientes virtualizados com desempenho otimizado. Inclui a interceção e o encaminhamento das chamadas CUDA para os recursos de GPU apropriados.

📖

termos

Encaminhamento de API

Mecanismo que interceta as chamadas de API gráficas ou de computação das VMs e as redireciona para a GPU física do anfitrião. Permite a compatibilidade com aplicações existentes sem modificação do código.

📖

termos

Alocação Baseada em Perfis

Estratégia de alocação de GPU baseada em perfis predefinidos de recursos (memória, computação, largura de banda). Permite adaptar precisamente os recursos da GPU às necessidades específicas das diferentes cargas de trabalho.

📖

termos

Particionamento de GPU

Processo de divisão lógica ou física dos recursos da GPU em segmentos menores atribuíveis a diferentes aplicações ou VMs. Inclui o particionamento da memória, das unidades de computação e dos controladores de memória.

📖

termos

Passthrough Mediado

Híbrido entre o passthrough direto e a virtualização completa, oferecendo acesso quase nativo à GPU com uma camada de mediação mínima. Combina desempenho ótimo com melhor gerenciamento de recursos e isolamento.

📖

termos

Agendador de GPU

Componente que gerencia o agendamento e a alocação de recursos da GPU entre múltiplas requisições concorrentes. Otimiza a utilização da GPU respeitando as prioridades e as restrições de qualidade de serviço.

📖

termos

Acesso Direto à GPU

Arquitetura que permite que aplicações virtualizadas acessem diretamente os recursos da GPU sem passar por camadas de emulação de software. Reduz a latência e maximiza o desempenho computacional.

📖

termos

Gerenciador de GPU Virtual

Software de administração centralizado que gerencia o ciclo de vida das instâncias vGPU, sua alocação e seu monitoramento. Coordena os recursos de GPU disponíveis de acordo com as políticas definidas pelo administrador.

📖

termos

Virtualização de Memória da GPU

Técnica de abstração da memória física da GPU permitindo que múltiplas VMs compartilhem a VRAM mantendo a ilusão de uma memória dedicada. Inclui paginação, alocação dinâmica e isolamento de memória.

📖

termos

SR-IOV para GPUs

Adaptação do padrão Single Root I/O Virtualization para GPUs, permitindo a criação de funções virtuais (VFs) com caminhos de acesso direto ao hardware. Oferece isolamento e desempenho próximos ao bare metal.

📖

termos

Containerização de GPU

Integração de recursos de GPU em contêineres leves com isolamento de drivers e bibliotecas CUDA. Permite uma implantação rápida de aplicações de GPU com sobrecarga mínima em comparação com VMs.

📖

termos

Virtualização Remota de GPU

Arquitetura que permite acessar recursos de GPU remotos via rede como se fossem locais. Utiliza protocolos otimizados para minimizar a latência e preservar o desempenho computacional.

📖

termos

Alocação Dinâmica de GPU

Capacidade de alocar e desalocar dinamicamente recursos de GPU de acordo com as necessidades instantâneas das aplicações. Otimiza a utilização das GPUs ajustando em tempo real as cotas de recursos.

📖

termos

Agrupamento de GPUs

Agregação de múltiplas GPUs físicas em um pool de recursos unificado e distribuível sob demanda. Permite o balanceamento de carga e a elasticidade dos recursos computacionais de GPU em escala de datacenter.

Glossário IA

GPU Passthrough

GPU Virtual (vGPU)

GPU Multi-Instância (MIG)

Partilha por Fatias de Tempo

Virtualização CUDA

Encaminhamento de API

Alocação Baseada em Perfis

Particionamento de GPU

Passthrough Mediado

Agendador de GPU

Acesso Direto à GPU

Gerenciador de GPU Virtual

Virtualização de Memória da GPU

SR-IOV para GPUs

Containerização de GPU

Virtualização Remota de GPU

Alocação Dinâmica de GPU

Agrupamento de GPUs

Nenhum resultado encontrado