এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
কার্নেল
জিপিইউতে একই সাথে প্রচুর থ্রেড দ্বারা কার্যকর করা একটি CUDA ফাংশন। কার্নেলটি CPU থেকে চালু করা হয় এবং একটি নির্দিষ্ট গ্রিড ও ব্লক কনফিগারেশনের সাথে GPU ডিভাইসে সমান্তরালভাবে কার্যকর করা হয়।
থ্রেড
CUDA-তে মৌলিক এক্সিকিউশন ইউনিট, যা GPU প্রসেসরের একটি কোরে কার্যকর করা একটি একক নির্দেশনা সিকোয়েন্সকে উপস্থাপন করে। থ্রেডগুলি ব্লকে সংগঠিত হয় এবং বিভিন্ন ডেটার উপর একই কোড কার্যকর করে।
ব্লক
থ্রেডের সংগ্রহ যা শেয়ার্ড মেমোরির মাধ্যমে একে অপরের সাথে যোগাযোগ করতে পারে এবং তাদের এক্সিকিউশন সিঙ্ক্রোনাইজ করতে পারে। ব্লকগুলি একটি গ্রিডে সংগঠিত হয় এবং একই স্ট্রিমিং মাল্টিপ্রসেসরে (SM) কার্যকর হয়।
গ্রিড
থ্রেড ব্লকের সেট যা একটি CUDA কার্নেলের সম্পূর্ণ এক্সিকিউশন কনফিগারেশন গঠন করে। গ্রিডটি CUDA-তে থ্রেড সংগঠনের সর্বোচ্চ স্তরের কাঠামোকে উপস্থাপন করে।
ওয়ার্প
32টি থ্রেডের গ্রুপ যা CUDA SM-এ SIMT (সিঙ্গেল ইনস্ট্রাকশন মাল্টিপল থ্রেড) মোডে একই সাথে কার্যকর হয়। একটি ওয়ার্পের সমস্ত থ্রেড একই ক্লক সাইকেলে একই নির্দেশনা কার্যকর করে।
শেয়ার্ড মেমোরি
দ্রুত এবং ছোট আকারের মেমোরি যা একই ব্লকের সমস্ত থ্রেড দ্বারা শেয়ার্ড হয়, থ্রেডগুলির মধ্যে দক্ষ যোগাযোগের সুবিধা দেয়। শেয়ার্ড মেমোরি গ্লোবাল মেমোরির চেয়ে অনেক দ্রুত কিন্তু ব্লক প্রতি আকারে সীমিত।
গ্লোবাল মেমোরি
সমস্ত থ্রেড এবং CPU দ্বারা অ্যাক্সেসযোগ্য প্রধান মেমোরি, যার বড় ক্ষমতা কিন্তু উচ্চ লেটেন্সি রয়েছে। গ্লোবাল মেমোরি কার্নেল লঞ্চের মধ্যে স্থায়ী হয় এবং ডেটা স্টোরেজের প্রধান এলাকা গঠন করে।
CUDA রানটাইম API
উচ্চ-স্তরের প্রোগ্রামিং ইন্টারফেস যা স্বয়ংক্রিয়ভাবে ইনিশিয়ালাইজেশন, মডিউল লোডিং এবং মেমোরি ম্যানেজমেন্ট পরিচালনা করে CUDA অ্যাপ্লিকেশন ডেভেলপমেন্ট সরলীকরণ করে। এটি cudaMalloc, cudaMemcpy এবং cudaLaunchKernel এর মতো ফাংশন প্রদান করে।
স্ট্রিম
জিপিইউতে নির্দিষ্ট ক্রমে সম্পাদিত অপারেশনের সিকোয়েন্স, যা গণনা অপারেশন এবং মেমরি স্থানান্তরের মধ্যে সমান্তরালতা অর্জন করতে সক্ষম করে। স্ট্রিমগুলি কার্নেলের সমবর্তী নির্বাহ এবং মেমরি স্থানান্তরের ওভারল্যাপ অনুমোদন করে।
অ্যাসিঙ্ক্রোনাস এক্সিকিউশন
CUDA-এর একটি নির্বাহ মোড যেখানে অপারেশনগুলি জিপিইউতে তাদের সমাপ্তির জন্য অপেক্ষা না করেই অবিলম্বে CPU-তে ফিরে আসে। অ্যাসিঙ্ক্রোনাস নির্বাহ জিপিইউর ব্যবহার সর্বাধিক করার জন্য গণনা এবং স্থানান্তরের ওভারল্যাপ করতে সক্ষম করে।
টেক্সচার মেমরি
২ডি বা ৩ডি স্থানিক লোকালিটি সহ অ্যাক্সেসের জন্য অপ্টিমাইজড মেমরি, স্বয়ংক্রিয়ভাবে ডেটা ক্যাশিং সহ। টেক্সচার মেমরি ইমেজ প্রসেসিং এবং কম কোহেরেন্স সহ অ্যাক্সেসের জন্য বিশেষভাবে কার্যকর।
কনস্ট্যান্ট মেমরি
ব্রডকাস্ট অ্যাক্সেসের জন্য অপ্টিমাইজড রিড-অনলি মেমরি যেখানে সমস্ত থ্রেড একই মান একই সাথে পড়ে। এটি বিশেষভাবে কার্যকর যখন একটি ওয়ার্পের সমস্ত থ্রেড একই অ্যাড্রেসে অ্যাক্সেস করে।
অকুপেন্সি
সক্রিয় ওয়ার্পের সংখ্যা এবং একটি স্ট্রিমিং মাল্টিপ্রসেসরে বসবাসকারী সর্বাধিক ওয়ার্পের সংখ্যার মধ্যে অনুপাতের পরিমাপ। উচ্চ অকুপেন্সি অগত্যা ভাল পারফরম্যান্সের গ্যারান্টি দেয় না তবে লেটেন্সি লুকাতে সাহায্য করে।
অ্যাটমিক অপারেশন
গ্লোবাল বা শেয়ার্ড মেমরিতে পরমাণুগতভাবে সম্পাদিত রিড-মডিফাই-রাইট অপারেশন, থ্রেডগুলির মধ্যে কোনও কনফ্লিক্ট নিশ্চিত করে। এগুলি রিডাকশন এবং ডেটার সমবর্তী আপডেটের জন্য অপরিহার্য।
cuBLAS
CUDA বেসিক লিনিয়ার অ্যালজেব্রা সাবরুটিন লাইব্রেরি যা বেসিক লিনিয়ার অ্যালজেব্রা অপারেশনের জন্য অপ্টিমাইজড জিপিইউ বাস্তবায়ন প্রদান করে। cuBLAS NVIDIA আর্কিটেকচারে ম্যাট্রিক্স এবং ভেক্টর গণনাগুলিকে উল্লেখযোগ্যভাবে ত্বরান্বিত করে।
cuFFT
CUDA ফাস্ট ফুরিয়ার ট্রান্সফর্ম লাইব্রেরি যা বিচ্ছিন্ন ফুরিয়ার ট্রান্সফর্মেশনের জন্য হাই পারফরম্যান্স জিপিইউ বাস্তবায়ন প্রদান করে। cuFFT বিভিন্ন প্রিসিশন এবং আকার সহ 1D, 2D এবং 3D ট্রান্সফর্মেশন সমর্থন করে।