CUDA প্রোগ্রামিং - কৃত্রিম বুদ্ধিমত্তা শব্দাবলী

📖

শব্দ

কার্নেল

জিপিইউতে একই সাথে প্রচুর থ্রেড দ্বারা কার্যকর করা একটি CUDA ফাংশন। কার্নেলটি CPU থেকে চালু করা হয় এবং একটি নির্দিষ্ট গ্রিড ও ব্লক কনফিগারেশনের সাথে GPU ডিভাইসে সমান্তরালভাবে কার্যকর করা হয়।

📖

শব্দ

থ্রেড

CUDA-তে মৌলিক এক্সিকিউশন ইউনিট, যা GPU প্রসেসরের একটি কোরে কার্যকর করা একটি একক নির্দেশনা সিকোয়েন্সকে উপস্থাপন করে। থ্রেডগুলি ব্লকে সংগঠিত হয় এবং বিভিন্ন ডেটার উপর একই কোড কার্যকর করে।

📖

শব্দ

থ্রেডের সংগ্রহ যা শেয়ার্ড মেমোরির মাধ্যমে একে অপরের সাথে যোগাযোগ করতে পারে এবং তাদের এক্সিকিউশন সিঙ্ক্রোনাইজ করতে পারে। ব্লকগুলি একটি গ্রিডে সংগঠিত হয় এবং একই স্ট্রিমিং মাল্টিপ্রসেসরে (SM) কার্যকর হয়।

📖

শব্দ

গ্রিড

থ্রেড ব্লকের সেট যা একটি CUDA কার্নেলের সম্পূর্ণ এক্সিকিউশন কনফিগারেশন গঠন করে। গ্রিডটি CUDA-তে থ্রেড সংগঠনের সর্বোচ্চ স্তরের কাঠামোকে উপস্থাপন করে।

📖

শব্দ

ওয়ার্প

32টি থ্রেডের গ্রুপ যা CUDA SM-এ SIMT (সিঙ্গেল ইনস্ট্রাকশন মাল্টিপল থ্রেড) মোডে একই সাথে কার্যকর হয়। একটি ওয়ার্পের সমস্ত থ্রেড একই ক্লক সাইকেলে একই নির্দেশনা কার্যকর করে।

📖

শব্দ

শেয়ার্ড মেমোরি

দ্রুত এবং ছোট আকারের মেমোরি যা একই ব্লকের সমস্ত থ্রেড দ্বারা শেয়ার্ড হয়, থ্রেডগুলির মধ্যে দক্ষ যোগাযোগের সুবিধা দেয়। শেয়ার্ড মেমোরি গ্লোবাল মেমোরির চেয়ে অনেক দ্রুত কিন্তু ব্লক প্রতি আকারে সীমিত।

📖

শব্দ

গ্লোবাল মেমোরি

সমস্ত থ্রেড এবং CPU দ্বারা অ্যাক্সেসযোগ্য প্রধান মেমোরি, যার বড় ক্ষমতা কিন্তু উচ্চ লেটেন্সি রয়েছে। গ্লোবাল মেমোরি কার্নেল লঞ্চের মধ্যে স্থায়ী হয় এবং ডেটা স্টোরেজের প্রধান এলাকা গঠন করে।

📖

শব্দ

CUDA রানটাইম API

উচ্চ-স্তরের প্রোগ্রামিং ইন্টারফেস যা স্বয়ংক্রিয়ভাবে ইনিশিয়ালাইজেশন, মডিউল লোডিং এবং মেমোরি ম্যানেজমেন্ট পরিচালনা করে CUDA অ্যাপ্লিকেশন ডেভেলপমেন্ট সরলীকরণ করে। এটি cudaMalloc, cudaMemcpy এবং cudaLaunchKernel এর মতো ফাংশন প্রদান করে।

📖

শব্দ

স্ট্রিম

জিপিইউতে নির্দিষ্ট ক্রমে সম্পাদিত অপারেশনের সিকোয়েন্স, যা গণনা অপারেশন এবং মেমরি স্থানান্তরের মধ্যে সমান্তরালতা অর্জন করতে সক্ষম করে। স্ট্রিমগুলি কার্নেলের সমবর্তী নির্বাহ এবং মেমরি স্থানান্তরের ওভারল্যাপ অনুমোদন করে।

📖

শব্দ

অ্যাসিঙ্ক্রোনাস এক্সিকিউশন

CUDA-এর একটি নির্বাহ মোড যেখানে অপারেশনগুলি জিপিইউতে তাদের সমাপ্তির জন্য অপেক্ষা না করেই অবিলম্বে CPU-তে ফিরে আসে। অ্যাসিঙ্ক্রোনাস নির্বাহ জিপিইউর ব্যবহার সর্বাধিক করার জন্য গণনা এবং স্থানান্তরের ওভারল্যাপ করতে সক্ষম করে।

📖

শব্দ

টেক্সচার মেমরি

২ডি বা ৩ডি স্থানিক লোকালিটি সহ অ্যাক্সেসের জন্য অপ্টিমাইজড মেমরি, স্বয়ংক্রিয়ভাবে ডেটা ক্যাশিং সহ। টেক্সচার মেমরি ইমেজ প্রসেসিং এবং কম কোহেরেন্স সহ অ্যাক্সেসের জন্য বিশেষভাবে কার্যকর।

📖

শব্দ

কনস্ট্যান্ট মেমরি

ব্রডকাস্ট অ্যাক্সেসের জন্য অপ্টিমাইজড রিড-অনলি মেমরি যেখানে সমস্ত থ্রেড একই মান একই সাথে পড়ে। এটি বিশেষভাবে কার্যকর যখন একটি ওয়ার্পের সমস্ত থ্রেড একই অ্যাড্রেসে অ্যাক্সেস করে।

📖

শব্দ

অকুপেন্সি

সক্রিয় ওয়ার্পের সংখ্যা এবং একটি স্ট্রিমিং মাল্টিপ্রসেসরে বসবাসকারী সর্বাধিক ওয়ার্পের সংখ্যার মধ্যে অনুপাতের পরিমাপ। উচ্চ অকুপেন্সি অগত্যা ভাল পারফরম্যান্সের গ্যারান্টি দেয় না তবে লেটেন্সি লুকাতে সাহায্য করে।

📖

শব্দ

অ্যাটমিক অপারেশন

গ্লোবাল বা শেয়ার্ড মেমরিতে পরমাণুগতভাবে সম্পাদিত রিড-মডিফাই-রাইট অপারেশন, থ্রেডগুলির মধ্যে কোনও কনফ্লিক্ট নিশ্চিত করে। এগুলি রিডাকশন এবং ডেটার সমবর্তী আপডেটের জন্য অপরিহার্য।

📖

শব্দ

cuBLAS

CUDA বেসিক লিনিয়ার অ্যালজেব্রা সাবরুটিন লাইব্রেরি যা বেসিক লিনিয়ার অ্যালজেব্রা অপারেশনের জন্য অপ্টিমাইজড জিপিইউ বাস্তবায়ন প্রদান করে। cuBLAS NVIDIA আর্কিটেকচারে ম্যাট্রিক্স এবং ভেক্টর গণনাগুলিকে উল্লেখযোগ্যভাবে ত্বরান্বিত করে।

📖

শব্দ

cuFFT

CUDA ফাস্ট ফুরিয়ার ট্রান্সফর্ম লাইব্রেরি যা বিচ্ছিন্ন ফুরিয়ার ট্রান্সফর্মেশনের জন্য হাই পারফরম্যান্স জিপিইউ বাস্তবায়ন প্রদান করে। cuFFT বিভিন্ন প্রিসিশন এবং আকার সহ 1D, 2D এবং 3D ট্রান্সফর্মেশন সমর্থন করে।

এআই গ্লসারি

কার্নেল

থ্রেড

ব্লক

গ্রিড

ওয়ার্প

শেয়ার্ড মেমোরি

গ্লোবাল মেমোরি

CUDA রানটাইম API

স্ট্রিম

অ্যাসিঙ্ক্রোনাস এক্সিকিউশন

টেক্সচার মেমরি

কনস্ট্যান্ট মেমরি

অকুপেন্সি

অ্যাটমিক অপারেশন

cuBLAS

cuFFT

কোন ফলাফল পাওয়া যায়নি