एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
VGAN (वीडियो जनरेटिव एडवरसैरियल नेटवर्क)
वीडियो जनरेशन के लिए एक अग्रणी GAN मॉडल जो प्रक्रिया को स्थिर छवि जनरेशन और गति जनरेशन में विभाजित करता है, जिसमें एक अलग इमेज जनरेटर और मोशन जनरेटर का उपयोग किया जाता है।
TGAN (टेम्पोरल जनरेटिव एडवरसैरियल नेटवर्क)
GANs का विस्तार जो वीडियो अनुक्रमों में अस्थायी निर्भरताओं को स्पष्ट रूप से मॉडल करने के लिए जनरेटर और डिस्क्रिमिनेटर में एक RNN (रिकरेंट न्यूरल नेटवर्क) संरचना को एकीकृत करता है।
MoCoGAN (मोशन एंड कंटेंट जनरेटिव एडवरसैरियल नेटवर्क)
एक आर्किटेक्चर जो अलग-अलग जनरेटर का उपयोग करके सामग्री (स्थिर उपस्थिति) और गति (अस्थायी गतिशीलता) के जनरेशन को अलग करता है, जिससे जेनरेट किए गए वीडियो तत्वों पर बेहतर नियंत्रण मिलता है।
3D डिस्क्रिमिनेटर
वीडियो GANs में एक प्रकार का डिस्क्रिमिनेटर जो जेनरेट किए गए अनुक्रमों की स्थानिक और अस्थायी संगति का एक साथ मूल्यांकन करने के लिए स्थानिक-अस्थायी वॉल्यूम (वीडियो क्यूब्स) पर काम करता है।
कंडीशनल इमेज जनरेटर
वीडियो GANs का एक घटक जो पिछली छवि और एक अव्यक्त गति वेक्टर के आधार पर प्रत्येक फ्रेम को जेनरेट करता है, जिससे लगातार छवियों के बीच दृश्य निरंतरता सुनिश्चित होती है।
अव्यक्त गति कारक
एक वीडियो GAN के अव्यक्त स्थान में एक चर जो विशेष रूप से गति और अस्थायी गतिशीलता की जानकारी को एन्कोड करता है, स्थिर उपस्थिति कारकों से अलग।
वीडियो-से-वीडियो प्रेडिक्शन
वीडियो GANs का एक अनुप्रयोग जहां मॉडल एक इनपुट अनुक्रम के आधार पर भविष्य के फ्रेम जेनरेट करता है, जिसका उपयोग वीडियो के प्रेडिक्शन और अस्थायी एक्स्ट्रापोलेशन के लिए किया जाता है।
स्थिर छवियों से वीडियो संश्लेषण
एक तकनीक जो स्थिर छवियों को एनिमेट करने के लिए वीडियो GANs का उपयोग करती है, जिससे मूल छवि की पहचान और विशेषताओं को बनाए रखते हुए विश्वसनीय गति उत्पन्न होती है।
स्थानिक-सामयिक सुसंगति
वीडियो GANs में एक मार्गदर्शक सिद्धांत जो यह सुनिश्चित करता है कि वस्तुएँ और दृश्य अंतरिक्ष (एक फ्रेम के भीतर) और समय (फ्रेमों के बीच) दोनों में सुसंगत गुण बनाए रखें।
पदानुक्रमित वीडियो GAN
एक बहु-स्तरीय वास्तुकला जहाँ एक पहला GAN कम-रिज़ॉल्यूशन वाले फ्रेम उत्पन्न करता है और एक दूसरा GAN उच्च-रिज़ॉल्यूशन वाले विवरणों को परिष्कृत करता है, जिससे वीडियो जनरेशन की गुणवत्ता और स्थिरता में सुधार होता है।
सामयिक विभेदक
वीडियो GANs में एक विशेष घटक जो विशेष रूप से अनुक्रमों की सामयिक सुसंगति का मूल्यांकन करता है, अक्सर फ्रेमों के बीच संक्रमण का विश्लेषण करने के लिए 3D नेटवर्क या आवर्ती आर्किटेक्चर का उपयोग करता है।
वीडियो अव्यक्त स्थान
एक बहुआयामी प्रतिनिधित्व जहाँ प्रत्येक बिंदु एक पूर्ण वीडियो अनुक्रम को एन्कोड करता है, जिससे एक सतत स्थान में विभिन्न उत्पन्न वीडियो के बीच नेविगेशन और इंटरपोलेशन संभव होता है।
सशर्त वीडियो GAN
वीडियो GAN का एक प्रकार जो विशिष्ट इनपुट शर्तों जैसे एक्शन क्लास, टेक्स्ट विवरण या पूर्वनिर्धारित गति प्रक्षेपवक्र के आधार पर अनुक्रम उत्पन्न करता है।
वीडियो प्रशिक्षण स्थिरता
वीडियो GANs में एक बड़ी चुनौती जो स्थानिक-सामयिक डेटा पर जनरेटर और विभेदक के बीच संतुलन बनाए रखने से संबंधित है, जिसके लिए विशेष अनुकूलन तकनीकों की आवश्यकता होती है।
पर्यवेक्षण रहित वीडियो GAN
एक दृष्टिकोण जहाँ मॉडल स्पष्ट सामयिक एनोटेशन के बिना सुसंगत वीडियो उत्पन्न करना सीखता है, कच्चे डेटा से गति संरचनाओं को स्वचालित रूप से खोजता है।
अव्यक्त उपस्थिति कारक
एक वीडियो GAN के अव्यक्त स्थान में एक आयाम जो किसी दृश्य की स्थिर विशेषताओं जैसे बनावट, रंग और आकार को कैप्चर करता है, सामयिक गतिशीलता से स्वतंत्र।
दीर्घकालिक वीडियो GAN
विस्तारित वीडियो अनुक्रम उत्पन्न करने के लिए एक विशेष वास्तुकला, जो लंबे समय तक संगति बनाए रखने हेतु स्मृति तंत्र और पदानुक्रमित संरचनाओं का उपयोग करती है।