এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
কন্ডিশনাল এমবেডিং
ক্লাস লেবেল (যেমন: 'গোল্ডেন রিট্রিভার') উচ্চ-মাত্রিক ভেক্টর স্পেসে প্রজেক্ট করা, যা জেনারেটর এবং ডিসক্রিমিনেটরে ইনজেক্ট করা হয় নির্দিষ্ট ক্লাসের ইমেজ জেনারেশন গাইড করার জন্য।
লেটেন্ট ট্রাঙ্কেশন
লেটেন্ট নয়েজ স্যাম্পলিং পদ্ধতি যা এর নর্ম সীমিত করে জেনারেটেড ইমেজের ডাইভারসিটি এবং ফিডেলিটির মধ্যে ট্রেড-অফ এক্সপ্লোর করে, সামান্য ভেরিয়েশনের বিনিময়ে উচ্চ-কোয়ালিটির স্যাম্পল পাওয়া সম্ভব করে।
লার্নেবল ব্যাচ নরমালাইজেশন
ব্যাচ নরমালাইজেশনের একটি ভেরিয়েন্ট যেখানে মিন এবং ভেরিয়েন্স প্যারামিটার ফিক্সড না বরং লার্ন করা হয়, জেনারেটরকে কমপ্লেক্স এবং মাল্টি-মোডাল ডিস্ট্রিবিউশন মডেল করার জন্য বাড়তি ফ্লেক্সিবিলিটি প্রদান করে।
এফআইডি স্কোর
ইভ্যালুয়েশন মেট্রিক (ফ্রেচেট ইনসেপশন ডিসট্যান্স) যা রিয়েল এবং জেনারেটেড ইমেজের ফিচার ডিস্ট্রিবিউশনের মধ্যে সিমিলারিটি মাপে, একটি প্রি-ট্রেইন্ড ক্লাসিফিকেশন নেটওয়ার্ক (ইনসেপশন v3) থেকে এক্সট্র্যাক্ট করা, যা GANs-এর কোয়ালিটি জাজ করার জন্য রেফারেন্স হয়ে উঠেছে।
ট্রেনিং স্ট্যাবিলিটি
বিগGAN-এর মতো লার্জ-স্কেল GANs ট্রেনিং-এ মেজর চ্যালেঞ্জ, যেখানে জেনারেটর এবং ডিসক্রিমিনেটরের মধ্যে ডেলিকেট ব্যালেন্স সহজেই ব্রোকেন হতে পারে, মোড কল্যাপস বা মডেল ডাইভারজেন্সের দিকে নিয়ে যায়।
ডিফারেনশিয়েবল ডেটা অগমেন্টেশন
ট্রেনিং সময় রিয়েল ইমেজের উপর জিওমেট্রিক বা ফটোমেট্রিক ট্রান্সফরমেশন (যেমন: রোটেশন, ট্রান্সলেশন) প্রয়োগ করা, গ্রেডিয়েন্টস এই অপারেশনের মাধ্যমে ব্যাকপ্রোপাগেট করতে পারে যা ডিসক্রিমিনেটরের রোবাস্টনেস ইমপ্রুভ করে।
ডিসক্রিমিনেটর প্রজেকশন
ডিসক্রিমিনেটর আর্কিটেকচার যেখানে ক্লাস এমবেডিং ফাইনাল কনভোলিউশন লেয়ারের আউটপুটের সাথে ডট প্রোডাক্ট অপারেশনের মাধ্যমে ইন্টিগ্রেটেড হয়, সরল কনক্যাটেনেশনের বদলে, ক্লাসিফিকেশন পারফরম্যান্স ইমপ্রুভ করে।
অটোরিগ্রেসিভ রেজোলিউশন
ইমেজ জেনারেশন স্ট্র্যাটেজি যেখানে মডেল লো-রেজোলিউশন ইমেজ প্রডিউস করে, তারপর ইটারেটিভলি তাদের আপ-স্যাম্পল করে হাই-ডেফিনিশনে পৌঁছায়, একটি অ্যাপ্রোচ যা বিগGAN GANs-এর সাথে কম্বাইন করে লার্জ-সাইজ ইমেজ হ্যান্ডেল করার জন্য।
মোড পতন
এমন একটি ঘটনা যেখানে জেনারেটর ডিসক্রিমিনেটরকে বোকা বানানোর চেষ্টা করতে গিয়ে সীমিত বৈচিত্র্যের নমুনা তৈরি করে (যেমন, প্রতি শ্রেণির জন্য একটি মাত্র ছবি), বাস্তব ডেটা বন্টনের বেশিরভাগ মোডকে উপেক্ষা করে।
লিপশিটজ নর্ম
ডিসক্রিমিনেটর ফাংশনের উপর একটি গাণিতিক সীমাবদ্ধতা যা তার ইনপুটের ছোট পরিবর্তনের সাপেক্ষে তার আউটপুট কত দ্রুত পরিবর্তন হতে পারে তা সীমিত করে, যা GAN প্রশিক্ষণের স্থিতিশীল অভিসৃতি নিশ্চিত করার জন্য অপরিহার্য।
উচ্চ-নির্ভরযোগ্যতা চিত্র সংশ্লেষণ
BigGAN-এর প্রধান লক্ষ্য, যা মানুষের চোখের জন্য ফটোরিয়েলিস্টিক বা বাস্তব ছবি থেকে আলাদা করা যায় না এমন ছবি তৈরি করা, বিষয়গতভাবে এবং FID স্কোরের মতো মেট্রিক্স দ্বারা মূল্যায়ন করা হয়।
শ্রেণি দ্বারা শর্তাধীনকরণ
একটি প্রক্রিয়া যা GAN-কে জেনারেশনের দিকনির্দেশনা দেওয়ার জন্য ইনপুট হিসাবে একটি শ্রেণি লেবেল সরবরাহ করে, উত্পাদিত ছবির ধরনের উপর স্পষ্ট নিয়ন্ত্রণ অনুমতি দেয় (যেমন: বিশেষভাবে একটি 'গোল্ডফিশ' বা 'স্পোর্টস কার' তৈরি করা)।
জেনারেটর-ডিসক্রিমিনেটর ভারসাম্য
GAN প্রশিক্ষণের একটি গতিশীল এবং ভঙ্গুর অবস্থা যেখানে জেনারেটর যথেষ্ট দক্ষ হয়ে ওঠে যাতে বাধ্যকারী নমুনা তৈরি করতে পারে, যখন ডিসক্রিমিনেটর উপযোগী গ্রেডিয়েন্ট সরবরাহ করার জন্য যথেষ্ট প্রতিযোগিতামূলক থাকে, খুব শক্তিশালী বা খুব দুর্বল কোনটিই নয়।