এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
Memory Coalescing
Technique d'optimisation sur GPU où les accès mémoire contigus des threads sont regroupés en transactions uniques, réduisant la bande passante mémoire et augmentant le débit.
Cache Blocking
Stratégie de partitionnement des données en blocs de taille adaptée au cache pour maximiser la réutilisation des données locales et minimiser les défauts de cache.
NUMA-Aware Allocation
Allocation mémoire prenant en compte l'architecture Non-Uniform Memory Access pour placer les données près des cœurs qui les utilisent fréquemment, réduisant la latence d'accès.
Memory Pooling
Pré-allocation d'un grand bloc mémoire subdivisé en objets réutilisables, éliminant la surcharge des allocations/désallocations dynamiques fréquentes.
Zero-Copy Optimization
Technique permettant aux opérations d'accéder directement aux données sans copie intermédiaire entre les espaces mémoire, réduisant la consommation CPU et la bande passante.
Register Tiling
Utilisation des registres processeur pour stocker temporairement des tuiles de données, minimisant les accès à la mémoire hiérarchique plus lente.
Prefetching Instructions
Instructions spéciales chargeant anticipativement les données en cache avant leur utilisation effective, masquant la latence mémoire par recouvrement calcul/accès.
Memory Footprint Reduction
Ensemble de techniques (quantification, pruning, compression) visant à réduire la taille mémoire des modèles IA sans dégradation significative des performances.
Shared Memory Utilization
একই ব্লকের থ্রেডগুলোর মধ্যে দ্রুত এবং পুনরায় ব্যবহারযোগ্য ডেটা স্পেস হিসেবে GPU শেয়ার্ড মেমরির ব্যবহার অপ্টিমাইজেশন।
Memory Bandwidth Saturation
এমন একটি অবস্থা যেখানে মেমরি অ্যাক্সেসের অনুরোধগুলো মেমরি বাসের ক্ষমতা অতিক্রম করে, যা কম্পিউটেশনাল পারফরম্যান্সের প্রধান বোতলনেক হয়ে ওঠে।
Page Migration
ডেটার লোকালিটি অপ্টিমাইজ করার জন্য অ্যাক্সেস প্যাটার্নের উপর ভিত্তি করে NUMA নোডগুলোর মধ্যে মেমরি পেজগুলোর ডাইনামিক স্থানান্তর।
Memory-Aware Scheduling
কন্টেনশন মিনিমাইজ করতে এবং প্যারালেলিজম ম্যাক্সিমাইজ করার জন্য মেমরি কনস্ট্রেইন্ট এবং অ্যাক্সেস প্যাটার্নগুলো বিবেচনা করে টাস্ক সিডিউলিং।
Cache-Oblivious Algorithms
ক্যাশের সাইজের জন্য নির্দিষ্ট প্যারামিটারের প্রয়োজন ছাড়াই যেকোনো ক্যাশে হায়ারার্কিতে কার্যকরভাবে পারফর্ম করার জন্য ডিজাইন করা অ্যালগরিদম।
Memory Hierarchy Optimization
মেমরি হায়ারার্কির বিভিন্ন স্তরে ডেটার অ্যাক্সেস ফ্রিকোয়েন্সি এবং টেম্পোরাল ক্রিটিক্যালিটির উপর ভিত্তি করে ডেটা প্লেসমেন্টের একটি সামগ্রিক কৌশল।
Tensor Core Memory Layout
NVIDIA টেনসর কোরগুলোতে ম্যাট্রিক্স অপারেশনের দক্ষতা ম্যাক্সিমাইজ করার জন্য মেমরিতে টেনসরগুলোর একটি নির্দিষ্ট সংগঠন।
Memory Access Divergence
এমন একটি ঘটনা যেখানে একটি GPU ওয়ার্পের থ্রেডগুলো অ-সংলগ্ন মেমরি অ্যাড্রেসে অ্যাক্সেস করে, যা অ্যাক্সেসের সিরিয়ালাইজেশনের মাধ্যমে পারফরম্যান্স হ্রাস করে।
HBM (হাই ব্যান্ডউইথ মেমরি) ইন্টিগ্রেশন
ইনটেনসিভ AI ওয়ার্কলোডের জন্য উচ্চতর ব্যান্ডউইথ প্রদানকারী 3D স্ট্যাকড মেমরি আর্কিটেকচার, অ্যাক্সেস প্যাটার্নের নির্দিষ্ট অপ্টিমাইজেশন সহ।
মেমরি-ম্যাপড I/O অপ্টিমাইজেশন
পেরিফেরালগুলিকে সরাসরি সিস্টেম মেমরিতে অ্যাক্সেস করার অনুমতি দেওয়ার কৌশল, যা AI পাইপলাইনে কপি এবং CPU ওভারহেড হ্রাস করে।