এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
থ্রেড ডাইভারজেন্স
একই ওয়ার্পের থ্রেডগুলো যখন বিভিন্ন এক্সিকিউশন পথ অনুসরণ করে, তখন ব্রাঞ্চ সিরিয়ালাইজেশন ঘটে এবং জিপিইউতে সমান্তরাল পারফরম্যান্স উল্লেখযোগ্যভাবে হ্রাস পায়।
শেয়ার্ড মেমোরি ব্যাঙ্ক কনফ্লিক্ট
যখন একই ওয়ার্পের একাধিক থ্রেড একই সাথে শেয়ার্ড মেমোরির একই ব্যাঙ্কে অ্যাক্সেস করার চেষ্টা করে, তখন অ্যাক্সেস সিরিয়ালাইজেশন ঘটে এবং কনটেনশন সৃষ্টি হয়।
ওয়ার্প শিডিউলিং
জিপিইউ স্কেডুলারের একটি মেকানিজম যা কম্পিউটেশন ইউনিটের ব্যবহার সর্বাধিক করতে এবং মেমোরি লেটেন্সি লুকানোর জন্য ওয়ার্পগুলোর শিডিউলিং অপ্টিমাইজ করে।
রেজিস্টার স্পিলিং
যখন রেজিস্টার অপর্যাপ্ত হয়, কম্পাইলারকে ডেটা রেজিস্টার থেকে স্থানীয় মেমোরিতে (ধীর) স্থানান্তর করতে হয়, যা পারফরম্যান্সকে উল্লেখযোগ্যভাবে হ্রাস করে।
ইনস্ট্রাকশন থ্রুপুট
প্রতি ক্লক সাইকেলে এক্সিকিউট করা যায় এমন ইনস্ট্রাকশনের সংখ্যার পরিমাপ, যা নেটিভ অ্যারিথমেটিক অপারেশনকে প্রাধান্য দিয়ে এবং জটিল ইনস্ট্রাকশন এড়িয়ে অপ্টিমাইজ করা হয়।
গ্রিড স্ট্রাইড লুপ
একটি লুপ প্যাটার্ন যেখানে প্রতিটি থ্রেড গ্রিডের মোট সাইজ দ্বারা ব্যবধানে একাধিক এলিমেন্ট প্রসেস করে, থ্রেড গ্রিডের চেয়ে বড় ডেটাসেট প্রসেস করা সম্ভব করে।
লুপ আনরোলিং
একটি অপ্টিমাইজেশন টেকনিক যা লুপ বডি ডুপ্লিকেট করে লুপ ইটারেশন দূর করে, লুপ কন্ট্রোল ওভারহেড কমায় এবং ইনস্ট্রাকশন লেভেলে প্যারালেলিজম বৃদ্ধি করে।
মেমোরি লেটেন্সি হাইডিং
একটি কৌশল যেখানে পর্যাপ্ত সংখ্যক ওয়ার্প লঞ্চ করা হয় যাতে অন্য ওয়ার্পগুলো মেমোরি অ্যাক্সেসের জন্য অপেক্ষারত অবস্থায় জিপিইউ প্রস্তুত ওয়ার্পগুলোর দিকে সুইচ করতে পারে।
ভেক্টর মেমরি অপারেশন
ইনস্ট্রাকশন যা একই সাথে একাধিক ডেটা (float2, float4) গ্লোবাল মেমরি এবং রেজিস্টারের মধ্যে স্থানান্তর করে, কার্যকর ব্যান্ডউইথ উন্নত করে।
কোঅপারেটিভ গ্রুপস
CUDA API যা ঐতিহ্যগত ব্লক সীমার বাইরে থ্রেডগুলোর মধ্যে নমনীয় এবং সম্মিলিত সিঙ্ক্রোনাইজেশন সক্ষম করে, জটিল কমিউনিকেশন প্যাটার্ন অপ্টিমাইজ করে।
টেক্সচার মেমরি ক্যাশিং
স্পেসিয়াল অ্যাক্সেসের জন্য অপ্টিমাইজড ক্যাশ সহ টেক্সচার মেমরি ব্যবহার, বিশেষ করে 2D লোকালিটি সহ অ্যাক্সেস প্যাটার্নের জন্য অত্যন্ত কার্যকর।
অ্যাটমিক অপারেশন অপ্টিমাইজেশন
অ্যাটমিক অপারেশনে কন্টেনশন কমানোর কৌশল, বিশেষ করে গ্লোবাল আপডেটের আগে লোকাল অ্যাগ্রিগেশনের জন্য শেয়ার্ড মেমরি ব্যবহার করে।
কার্নেল লঞ্চ ওভারহেড
GPU কার্নেল চালু করার সাথে সম্পর্কিত সময় খরচ, একাধিক ছোট কার্নেলকে একটি বড় কার্নেলে একত্রিত করে বা ডাইনামিক প্যারালেলিজম ব্যবহার করে হ্রাস করা হয়।
ওয়ার্ক ডিস্ট্রিবিউশন ব্যালেন্স
কিছু থ্রেড অন্যদের তুলনায় অনেক আগে শেষ হওয়ার মতো লোড ভারসাম্যহীনতা এড়াতে থ্রেডগুলোর মধ্যে কাজ বন্টন অপ্টিমাইজ করা।
প্রিফেচিং স্ট্র্যাটেজি
ব্যবহারের আগে শেয়ার্ড মেমরিতে ডেটা লোড করার পূর্বসূচক কৌশল, এইভাবে গ্লোবাল মেমরি অ্যাক্সেসের লেটেন্সি লুকিয়ে রাখা।