এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
CUDA
Architecture de calcul parallèle et interface de programmation créée par NVIDIA, permettant aux développeurs d'utiliser les GPU pour des calculs généraux via des extensions au langage C/C++.
Tensor Core
Unités de calcul spécialisées intégrées dans les GPU NVIDIA modernes, conçues pour accélérer de manière exponentielle les opérations de multiplication et d'addition de matrices, fondamentales pour les réseaux de neurones profonds.
ROCm
Plateforme de calcul open source pour les GPU AMD, offrant un écosystème complet de langages de programmation (HIP), de bibliothèques (MIOpen) et d'outils pour le calcul haute performance et l'IA.
OpenCL
Norme ouverte pour l'écriture de programmes s'exécutant sur des plateformes hétérogènes, incluant les CPU, GPU et autres processeurs, en définissant un langage basé sur C99 et des API pour la gestion des périphériques.
cuDNN
Bibliothèque GPU accélérée de primitives pour les réseaux de neurones profonds, développée par NVIDIA, fournissant des implémentations hautement optimisées pour les routines de convolution, de pooling et de normalisation.
Memory Bandwidth
Débit de données maximal entre le GPU et sa mémoire vidéo (VRAM), mesuré en GB/s, constituant un facteur critique pour la performance des calculs intensifs et l'entraînement de grands modèles d'IA.
Kernel
Fonction principale exécutée sur le GPU dans un programme de calcul parallèle, lancée sur une grille de threads et conçue pour traiter une portion spécifique des données de manière simultanée.
Warp
Groupe de 32 threads exécutés en mode SIMT (Single Instruction, Multiple Thread) sur les GPU NVIDIA, partageant le même flux d'instructions et constituant l'unité de scheduling de base pour l'exécution parallèle.
Stream Multiprocessor (SM)
একটি NVIDIA GPU-এর মৌলিক কম্পিউটিং ইউনিট, যাতে কোর, শেয়ার্ড মেমরি ইউনিট এবং শিডিউলার রয়েছে, যা একই সাথে একাধিক থ্রেড ব্লক চালানো এবং তাদের এক্সিকিউশন পরিচালনা করতে সক্ষম।
Shared Memory
একটি GPU-এর একই ব্লকের থ্রেডগুলির মধ্যে ভাগ করা দ্রুত এবং কম লেটেন্সির মেমরি স্পেস, যা সহযোগিতা এবং অনেক ধীর গ্লোবাল মেমরিতে অ্যাক্সেস কমাতে সাহায্য করে।
Unified Memory
একটি মেমরি ম্যানেজমেন্ট প্রযুক্তি যা CPU এবং GPU-এর মধ্যে একটি একক অ্যাড্রেস স্পেস তৈরি করে, ডেটার স্পষ্ট কপি করার প্রয়োজনীয়তা দূর করে এবং হেটেরোজিনিয়াস অ্যাপ্লিকেশন ডেভেলপমেন্টকে সহজ করে।
NVLink
NVIDIA দ্বারা বিকশিত একটি উচ্চ-ব্যান্ডউইথ ইন্টারকানেকশন প্রযুক্তি, যা একাধিক GPU-এর মধ্যে সরাসরি এবং দ্রুত যোগাযোগের অনুমতি দেয়, বিতরণকৃত কম্পিউটিংয়ের জন্য PCIe বাসের সীমাবদ্ধতা অতিক্রম করে।
FP16 (Half-Precision)
১৬-বিট ফ্লোটিং-পয়েন্ট নম্বর ফরম্যাট, যা নিউরাল নেটওয়ার্কে গণনা ত্বরান্বিত করতে এবং মেমরি ফুটপ্রিন্ট কমাতে ব্যবহৃত হয়, প্রায়শই গ্রহণযোগ্য একটি সামান্য নির্ভুলতা হ্রাসের বিনিময়ে।
CUDA Graphs
একটি প্রযুক্তি যা CUDA অপারেশনের একটি সম্পূর্ণ ক্রমকে একটি গ্রাফে ক্যাপচার করতে এবং তারপর ন্যূনতম ওভারহেড সহ পুনরায় এক্সিকিউট করতে দেয়, পুনরাবৃত্তিমূলক ওয়ার্কলোডের জন্য কার্নেল লঞ্চ খরচ কমায়।
HIP
AMD দ্বারা বিকশিত একটি প্রোগ্রামিং API এবং কম্পাইলেশন ভাষা, যা CUDA-এর একটি পোর্টেবল বিকল্প হিসাবে ডিজাইন করা হয়েছে, CUDA কোডকে AMD GPU-এ সহজে মাইগ্রেট করতে সহায়তা করে।
MIOpen
AMD-এর ROCm প্ল্যাটফর্মে ডিপ নিউরাল নেটওয়ার্কের জন্য একটি অপ্টিমাইজেশন লাইব্রেরি, যা কনভোলিউশন, পুলিং এবং নর্মালাইজেশন স্তরের জন্য উচ্চ-পারফরম্যান্স বাস্তবায়ন প্রদান করে।
Compute Capability
একটি NVIDIA GPU-এর বৈশিষ্ট্য এবং কার্যকারিতা বর্ণনা করে এমন সংস্করণ সংখ্যা, যার মধ্যে কোর সংখ্যা, আর্কিটেকচার, সমর্থিত নির্দেশনা এবং গণনার ক্ষমতা অন্তর্ভুক্ত রয়েছে, যা সফ্টওয়্যারের সামঞ্জস্যতার জন্য অপরিহার্য।
Coalesced Memory Access
মেমরি অ্যাক্সেসের একটি অপ্টিমাইজেশান যেখানে একটি ওয়ার্পের সংলগ্ন থ্রেডগুলি ক্রমাগত মেমরি অবস্থানগুলিতে অ্যাক্সেস করে, যা এই অনুরোধগুলিকে একটি একক, বিস্তৃত এবং কার্যকর মেমরি লেনদেনে একত্রিত করতে দেয়।