Глоссарий ИИ
Полный словарь искусственного интеллекта
Memory Registers
Mémoire la plus rapide et privée de chaque thread SM (Streaming Multiprocessor), utilisée pour stocker les variables locales avec une latence d'accès d'un cycle d'horloge.
Memory Thrashing
Phénomène de performance dégradée lors d'accès mémoire non optimisés générant un taux élevé de cache misses et de conflits de banques mémoire.
Memory Bank Conflicts
Concurrence d'accès simultané à différents emplacements du même banc mémoire partagée, entraînant une sérialisation des accès et une réduction de performance.
Asynchronous Memory Transfer
Transferts de données CPU-GPU exécutés en parallèle des calculs kernels via CUDA streams, masquant la latence mémoire et optimisant l'utilisation du GPU.
Memory Alignment
Alignement des structures de données sur des frontières d'octets spécifiques (128, 256, 512 bits) pour garantir des transactions mémoire coalescentes et maximales.
Zero-Copy Memory
Technique permettant au GPU d'accéder directement à la mémoire hôte sans copie, utilisant memory mapping pour réduire la consommation mémoire et les temps de transfert.
CUDA Streams
Séquence d'opérations exécutées dans l'ordre sur le GPU permettant le parallélisme de tâches et le recouvrement calcul-transfert pour optimiser l'utilisation des ressources.
Memory Pool
Pré-allocation d'un bloc mémoire GPU pour allocations/désallocations rapides, réduisant la fragmentation et les coûts d'allocation dynamique pendant l'exécution.
Memory Prefetching
Chargement anticipé des données dans la mémoire cache GPU avant leur utilisation effective, masquant la latence mémoire et améliorant le parallélisme instruction-données.
Memory Paging
Gestion des pages mémoire entre CPU et GPU impliquant migration à la demande et éviction basée sur l'utilisation pour optimiser l'utilisation de la mémoire GPU limitée.
CUDA Unified Virtual Addressing
Espace d'adressage virtuel unique combinant mémoire hôte et device, permettant des transferts transparents et des pointeurs valides entre CPU et GPU.
Memory Occupancy
Ratio de warps actifs par SM impacté par l'utilisation mémoire, déterminant le niveau de parallélisme réalisable et l'efficacité d'utilisation des ressources GPU.