GPU কম্পিউটিং আইএর জন্য - কৃত্রিম বুদ্ধিমত্তা শব্দাবলী

📖

শব্দ

CUDA

Architecture de calcul parallèle et interface de programmation créée par NVIDIA, permettant aux développeurs d'utiliser les GPU pour des calculs généraux via des extensions au langage C/C++.

📖

শব্দ

Unités de calcul spécialisées intégrées dans les GPU NVIDIA modernes, conçues pour accélérer de manière exponentielle les opérations de multiplication et d'addition de matrices, fondamentales pour les réseaux de neurones profonds.

📖

শব্দ

ROCm

Plateforme de calcul open source pour les GPU AMD, offrant un écosystème complet de langages de programmation (HIP), de bibliothèques (MIOpen) et d'outils pour le calcul haute performance et l'IA.

📖

শব্দ

OpenCL

Norme ouverte pour l'écriture de programmes s'exécutant sur des plateformes hétérogènes, incluant les CPU, GPU et autres processeurs, en définissant un langage basé sur C99 et des API pour la gestion des périphériques.

📖

শব্দ

cuDNN

Bibliothèque GPU accélérée de primitives pour les réseaux de neurones profonds, développée par NVIDIA, fournissant des implémentations hautement optimisées pour les routines de convolution, de pooling et de normalisation.

📖

শব্দ

Memory Bandwidth

Débit de données maximal entre le GPU et sa mémoire vidéo (VRAM), mesuré en GB/s, constituant un facteur critique pour la performance des calculs intensifs et l'entraînement de grands modèles d'IA.

📖

শব্দ

Kernel

Fonction principale exécutée sur le GPU dans un programme de calcul parallèle, lancée sur une grille de threads et conçue pour traiter une portion spécifique des données de manière simultanée.

📖

শব্দ

Warp

Groupe de 32 threads exécutés en mode SIMT (Single Instruction, Multiple Thread) sur les GPU NVIDIA, partageant le même flux d'instructions et constituant l'unité de scheduling de base pour l'exécution parallèle.

📖

শব্দ

Stream Multiprocessor (SM)

একটি NVIDIA GPU-এর মৌলিক কম্পিউটিং ইউনিট, যাতে কোর, শেয়ার্ড মেমরি ইউনিট এবং শিডিউলার রয়েছে, যা একই সাথে একাধিক থ্রেড ব্লক চালানো এবং তাদের এক্সিকিউশন পরিচালনা করতে সক্ষম।

📖

শব্দ

Shared Memory

একটি GPU-এর একই ব্লকের থ্রেডগুলির মধ্যে ভাগ করা দ্রুত এবং কম লেটেন্সির মেমরি স্পেস, যা সহযোগিতা এবং অনেক ধীর গ্লোবাল মেমরিতে অ্যাক্সেস কমাতে সাহায্য করে।

📖

শব্দ

Unified Memory

একটি মেমরি ম্যানেজমেন্ট প্রযুক্তি যা CPU এবং GPU-এর মধ্যে একটি একক অ্যাড্রেস স্পেস তৈরি করে, ডেটার স্পষ্ট কপি করার প্রয়োজনীয়তা দূর করে এবং হেটেরোজিনিয়াস অ্যাপ্লিকেশন ডেভেলপমেন্টকে সহজ করে।

📖

শব্দ

NVLink

NVIDIA দ্বারা বিকশিত একটি উচ্চ-ব্যান্ডউইথ ইন্টারকানেকশন প্রযুক্তি, যা একাধিক GPU-এর মধ্যে সরাসরি এবং দ্রুত যোগাযোগের অনুমতি দেয়, বিতরণকৃত কম্পিউটিংয়ের জন্য PCIe বাসের সীমাবদ্ধতা অতিক্রম করে।

📖

শব্দ

FP16 (Half-Precision)

১৬-বিট ফ্লোটিং-পয়েন্ট নম্বর ফরম্যাট, যা নিউরাল নেটওয়ার্কে গণনা ত্বরান্বিত করতে এবং মেমরি ফুটপ্রিন্ট কমাতে ব্যবহৃত হয়, প্রায়শই গ্রহণযোগ্য একটি সামান্য নির্ভুলতা হ্রাসের বিনিময়ে।

📖

শব্দ

CUDA Graphs

একটি প্রযুক্তি যা CUDA অপারেশনের একটি সম্পূর্ণ ক্রমকে একটি গ্রাফে ক্যাপচার করতে এবং তারপর ন্যূনতম ওভারহেড সহ পুনরায় এক্সিকিউট করতে দেয়, পুনরাবৃত্তিমূলক ওয়ার্কলোডের জন্য কার্নেল লঞ্চ খরচ কমায়।

📖

শব্দ

HIP

AMD দ্বারা বিকশিত একটি প্রোগ্রামিং API এবং কম্পাইলেশন ভাষা, যা CUDA-এর একটি পোর্টেবল বিকল্প হিসাবে ডিজাইন করা হয়েছে, CUDA কোডকে AMD GPU-এ সহজে মাইগ্রেট করতে সহায়তা করে।

📖

শব্দ

MIOpen

AMD-এর ROCm প্ল্যাটফর্মে ডিপ নিউরাল নেটওয়ার্কের জন্য একটি অপ্টিমাইজেশন লাইব্রেরি, যা কনভোলিউশন, পুলিং এবং নর্মালাইজেশন স্তরের জন্য উচ্চ-পারফরম্যান্স বাস্তবায়ন প্রদান করে।

📖

শব্দ

Compute Capability

একটি NVIDIA GPU-এর বৈশিষ্ট্য এবং কার্যকারিতা বর্ণনা করে এমন সংস্করণ সংখ্যা, যার মধ্যে কোর সংখ্যা, আর্কিটেকচার, সমর্থিত নির্দেশনা এবং গণনার ক্ষমতা অন্তর্ভুক্ত রয়েছে, যা সফ্টওয়্যারের সামঞ্জস্যতার জন্য অপরিহার্য।

📖

শব্দ

Coalesced Memory Access

মেমরি অ্যাক্সেসের একটি অপ্টিমাইজেশান যেখানে একটি ওয়ার্পের সংলগ্ন থ্রেডগুলি ক্রমাগত মেমরি অবস্থানগুলিতে অ্যাক্সেস করে, যা এই অনুরোধগুলিকে একটি একক, বিস্তৃত এবং কার্যকর মেমরি লেনদেনে একত্রিত করতে দেয়।

এআই গ্লসারি

CUDA

Tensor Core

ROCm

OpenCL

cuDNN

Memory Bandwidth

Kernel

Warp

Stream Multiprocessor (SM)

Shared Memory

Unified Memory

NVLink

FP16 (Half-Precision)

CUDA Graphs

HIP

MIOpen

Compute Capability

Coalesced Memory Access

কোন ফলাফল পাওয়া যায়নি