এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
লেটেন্ট ডিফিউশন মডেল
একটি ডিফিউশন আর্কিটেকচার যা কম মাত্রার লেটেন্ট স্পেসে কাজ করে, অটোএনকোডারের মাধ্যমে প্রাপ্ত, যা উচ্চমানের ইমেজ জেনারেশন বজায় রাখার পাশাপাশি গণনীয় খরচ উল্লেখযোগ্যভাবে হ্রাস করে।
পারসেপচুয়াল এনকোডার
এলডিএম-এ অটোএনকোডারের অংশ যা উচ্চ-মাত্রিক ইমেজ (পিক্সেল) কম মাত্রার উপস্থাপনায় (লেটেন্ট) রূপান্তর করে, প্রয়োজনীয় সেমান্টিক তথ্য ক্যাপচার করে।
ক্রস-অ্যাটেনশন কন্ডিশনিং
একটি অ্যাটেনশন মেকানিজম যা লেটেন্ট ডিফিউশন মডেলকে হেটেরোজেনাস তথ্য একীভূত করতে দেয়, যেমন টেক্সট (CLIP এম্বেডিং), যাতে নমনীয় এবং সুনির্দিষ্টভাবে ইমেজ জেনারেশন গাইড করা যায়।
নয়েজ শিডিউলার
একটি অ্যালগরিদম যা ফরওয়ার্ড প্রসেসের প্রতিটি টাইম স্টেপে যোগ করা নয়েজের ভ্যারিয়েন্স নির্ধারণ করে, এলডিএম-এ জেনারেশনের কনভারজেন্স স্পিড এবং ফাইনাল কোয়ালিটিকে প্রভাবিত করে।
নয়েজ রিগ্রেশন (ডিনয়েজিং)
ইউ-নেট ডিফিউশন মডেলের প্রধান টাস্ক, যা একটি প্রদত্ত টাইম স্টেপে লেটেন্টে যোগ করা নয়েজ প্রেডিক্ট করে, সিগন্যাল ধীরে ধীরে ডিনয়েজ করার জন্য এটি বিয়োগ করতে দেয়।
হায়ারার্কিক্যাল ইউ-নেট
ইউ-আকৃতির নিউরাল নেটওয়ার্ক আর্কিটেকচার, রেসিডুয়াল কানেকশন এবং অ্যাটেনশন মেকানিজম সহ, প্রতিটি ডিনয়েজিং স্টেপে নয়েজ প্রেডিক্ট করার জন্য ডিফিউশন মডেলের কোর হিসেবে ব্যবহৃত।
ক্লাসিফায়ার-ফ্রি গাইডেন্স (CFG)
একটি কন্ডিশনিং পদ্ধতি যা প্রম্প্টের সাথে সঙ্গতি বাড়ানোর জন্য মডেলের নিজের লগ-প্রোবাবিলিটির গ্রেডিয়েন্ট ব্যবহার করে, বাহ্যিক ক্লাসিফায়ারের প্রয়োজন এড়ায় এবং টেক্সট ফাইডেলিটি উন্নত করে।
স্টেবল ডিফিউশন
লেটেন্ট ডিফিউশন মডেল আর্কিটেকচারের বিখ্যাত এবং ওপেন-সোর্স ইমপ্লিমেন্টেশন, একটি VAE, ইউ-নেট এবং CLIP-এর মাধ্যমে টেক্সট কন্ডিশনিং কম্বাইন করে অ্যাক্সেসিবল এবং পারফরম্যান্ট ইমেজ জেনারেশনের জন্য।
স্টোকাস্টিক স্কোর ম্যাচিং (SDE)
ডিফিউশন মডেলগুলির জন্য একটি বিকল্প তাত্ত্বিক কাঠামো, যা ডেটা ঘনত্বের গ্রেডিয়েন্ট (স্কোর) শেখার জন্য স্টোকাস্টিক ডিফারেনশিয়াল ইকুয়েশন সমাধান হিসাবে ব্যাখ্যা করে।
লেটেন্ট রিস্যাম্পলিং
একটি অনুমান কৌশল যা লেটেন্ট স্পেসে ডিনয়েজিং ট্র্যাজেক্টরি গতিশীলভাবে পরিবর্তন করে, সময়ের ধাপ বা গাইডেন্স সামঞ্জস্য করে জেনারেশনের সামঞ্জস্য এবং গুণমান উন্নত করে।
টাইম ডিস্টিলেশন
মডেল কম্প্রেশন প্রক্রিয়া যেখানে একটি বড়, ধীর ডিফিউশন মডেল ব্যবহার করে একটি ছোট, দ্রুত মডেল প্রশিক্ষিত করা হয়, যা কম ডিনয়েজিং ধাপে তুলনামূলক গুণমানের ইমেজ তৈরি করতে সক্ষম।
কনসিসটেন্ট ডিনয়েজিং
অনুমান পদ্ধতির একটি পরিবার যা ডিনয়েজিং প্রক্রিয়া আনুমানিক করার জন্য একটি সাধারণ ডিফারেনশিয়াল ইকুয়েশন (ODE) সমাধান করে, একক বা খুব কম ধাপে উচ্চ-গুণমানের জেনারেশন সম্ভব করে।
প্রম্পট টোকেনাইজেশন
প্রিপ্রসেসিং ধাপ যেখানে ইনপুট টেক্সট একটি সংখ্যাসূচক আইডেন্টিফায়ার সিকোয়েন্স (টোকেন) এ রূপান্তরিত হয়, যা পরে ল্যাঙ্গুয়েজ মডেল (যেমন: CLIP) দ্বারা এমবেডিংয়ে রূপান্তরিত হয়ে কন্ডিশনিংয়ের জন্য ব্যবহৃত হয়।
KL রিকনস্ট্রাকশন লস
একটি LDM-এর VAE প্রশিক্ষণে নিয়মিতকরণ শব্দ, যা শেখা লেটেন্ট ডিস্ট্রিবিউশন এবং একটি প্রায়র ডিস্ট্রিবিউশন (সাধারণত স্ট্যান্ডার্ড গাউসিয়ান) এর মধ্যে কুলব্যাক-লেইব্লার ডাইভারজেন্স পরিমাপ করে।
টেক্সচুয়াল এমবেডিং স্পেস
উচ্চ-মাত্রিক ভেক্টর স্পেস যেখানে টেক্সট (প্রম্পট) এমবেডিং আকারে উপস্থাপিত হয়, ক্রস-অ্যাটেনশন মেকানিজমের মাধ্যমে ডিফিউশন মডেলকে কন্ডিশনিং সরবরাহ করে।