Glosarium AI
Kamus lengkap Kecerdasan Buatan
Kernel
Fonction exécutée sur le GPU par de multiples threads en parallèle, constituant l'unité fondamentale de calcul dans les programmes CUDA pour accélérer les opérations mathématiques intensives.
Thread Block
Groupe de threads qui peuvent communiquer entre eux via la mémoire partagée et synchroniser leur exécution, constituant l'unité d'ordonnancement de base sur les multiprocesseurs streaming (SM) du GPU.
Warp
Groupe de 32 threads exécutés simultanément en mode SIMD (Single Instruction, Multiple Data) sur les processeurs NVIDIA, représentant l'unité d'exécution matérielle fondamentale.
Grid
Ensemble de blocs de threads qui exécutent un même kernel, organisé en structure 1D, 2D ou 3D pour mapper efficacement les problèmes de calcul sur l'architecture GPU.
Occupancy
Ratio entre le nombre de warps actifs et le nombre maximum de warps qu'un multiprocesseur peut supporter simultanément, métrique clé pour optimiser l'utilisation des ressources du GPU.
Host-Device Communication
Mécanisme de transfert de données entre la mémoire du CPU (host) et la mémoire du GPU (device) via le bus PCIe, représentant souvent le goulot d'étranglement dans les applications hétérogènes.
PTX
Langage intermédiaire de bas niveau pour les GPUs NVIDIA, optimisé pour le parallélisme de thread et servant de cible portable pour les compilateurs CUDA avant la traduction en code machine spécifique.
Thrust Library
Bibliothèque de templates C++ pour CUDA offrant une interface de haut niveau similaire à la STL pour les algorithmes parallèles sur GPU comme le tri, la réduction et la scan.