Glossário IA
O dicionário completo da Inteligência Artificial
Kernel
Função executada na GPU por múltiplos threads em paralelo, constituindo a unidade fundamental de cálculo em programas CUDA para acelerar operações matemáticas intensivas.
Thread Block
Grupo de threads que podem comunicar entre si através da memória partilhada e sincronizar a sua execução, constituindo a unidade de agendamento básica nos multiprocessadores de streaming (SM) da GPU.
Warp
Grupo de 32 threads executados simultaneamente em modo SIMD (Single Instruction, Multiple Data) nos processadores NVIDIA, representando a unidade de execução de hardware fundamental.
Grid
Conjunto de blocos de threads que executam o mesmo kernel, organizado em estrutura 1D, 2D ou 3D para mapear eficientemente os problemas de cálculo na arquitetura da GPU.
Occupancy
Rácio entre o número de warps ativos e o número máximo de warps que um multiprocessador pode suportar simultaneamente, métrica chave para otimizar a utilização dos recursos da GPU.
Host-Device Communication
Mecanismo de transferência de dados entre a memória da CPU (host) e a memória da GPU (device) via o bus PCIe, representando frequentemente o gargalo em aplicações heterogéneas.
PTX
Linguagem intermédia de baixo nível para GPUs NVIDIA, otimizada para paralelismo de threads e servindo como alvo portátil para compiladores CUDA antes da tradução para código de máquina específico.
Thrust Library
Biblioteca de templates C++ para CUDA que oferece uma interface de alto nível semelhante à STL para algoritmos paralelos na GPU como ordenação, redução e scan.