এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
টেক্সট এনকোডার (CLIP)
বর্ণনামূলক টেক্সট (প্রম্পট)কে ল্যাটেন্ট স্পেসে একটি সংখ্যাসূচক ভেক্টরে রূপান্তরকারী উপাদান, যা সংশ্লিষ্ট ছবি তৈরি করতে ডিফিউশন মডেলকে নির্দেশনা দেয়।
Img2Img
একটি প্রারম্ভিক ছবিকে ভিত্তি হিসেবে ব্যবহার করে জেনারেশন প্রক্রিয়া, যা টেক্সচুয়াল প্রম্পট অনুযায়ী রূপান্তরিত হয় এবং তার মূল কাঠামোর একটি অংশ সংরক্ষণ করে।
স্টেপস (ডিনোইজিং ধাপ)
পুনরাবৃত্তির সংখ্যা যেখানে মডেল ধীরে ধীরে নয়েজ সরিয়ে দেয়; বেশি ধাপ সাধারণত আরও বিস্তারিত ফলাফল দেয় কিন্তু গণনার সময় বাড়ায়।
CFG স্কেল (ক্লাসিফায়ার-ফ্রি গাইডেন্স)
টেক্সচুয়াল প্রম্পটের প্রতি মডেলের আনুগত্য নিয়ন্ত্রণকারী প্যারামিটার; উচ্চ মান সৃজনশীলতার বিনিময়ে প্রম্পটের প্রতি বিশ্বস্ততা শক্তিশালী করে।
সীড (বীজ)
প্রাথমিক সংখ্যাসূচক মান যা র্যান্ডম নম্বর জেনারেটর শুরু করে, একই প্যারামিটার সহ ছবির জেনারেশনকে ঠিক একইভাবে পুনরুত্পাদন করতে সক্ষম করে।
চেকপয়েন্ট
একটি সম্পূর্ণ স্টেবল ডিফিউশন মডেলের প্রশিক্ষিত ওয়েট ধারণকারী বাইনারি ফাইল, যা তার স্টাইল, জ্ঞান এবং জেনারেশন ক্ষমতা সংজ্ঞায়িত করে।
সেফটি চেকার
অন্তর্নির্মিত মেকানিজম, প্রায়শই CLIP মডেল ভিত্তিক, যা জেনারেট করা ছবিগুলি বিশ্লেষণ করে এবং সম্ভাব্য সংবেদনশীল বা অনুপযুক্ত বিষয়বস্তু সনাক্ত করলে ব্লার করে।
ল্যাটেন্ট ডিফিউশন
স্টেবল ডিফিউশনের ভিত্তিমূলক নীতি যা ডিফিউশন প্রক্রিয়াটি ছবির পিক্সেলে নয়, বরং ল্যাটেন্ট স্পেসে এর সংকুচিত উপস্থাপনায় প্রয়োগ করে।