एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
Seq2Seq आर्किटेक्चर
एनकोडर और डिकोडर से युक्त गहन शिक्षण मॉडल जो चर-लंबाई वाले अनुक्रमों को अन्य अनुक्रमों में बदलने के लिए डिज़ाइन किया गया है। यह आर्किटेक्चर मूल रूप से स्वचालित अनुवाद, पाठ सारांश और संवाद निर्माण जैसे कार्यों के लिए उपयोग किया जाता है।
टीचर फोर्सिंग
प्रशिक्षण रणनीति जहां डिकोडर को इनपुट के रूप में अपनी भविष्यवाणियों के बजाय पिछले वास्तविक मान प्राप्त होते हैं, जो अभिसरण को तेज करता है। यह तकनीक शिक्षण को स्थिर करती है लेकिन एक्सपोजर बायस के रूप में जानी जाने वाली प्रशिक्षण और अनुमान के बीच विचलन पैदा कर सकती है।
मास्किंग
अनुक्रमों की कुछ स्थितियों को छिपाने की प्रक्रिया ताकि मॉडल अप्रासंगिक या भविष्य की जानकारी का संसाधन न करे। मास्किंग चर-लंबाई वाले अनुक्रमों को प्रबंधित करने और स्व-प्रतिगामी प्रशिक्षण के दौरान धोखाधड़ी को रोकने के लिए आवश्यक है।
एम्बेडिंग वेक्टर
असतत टोकन का एक सघन वेक्टर प्रतिनिधित्व जो एक निरंतर स्थान में अर्थगत और वाक्यविन्यास संबंधों को कैप्चर करता है। एम्बेडिंग प्रशिक्षण के दौरान सीखी जाती हैं और अनुक्रम प्रसंस्करण मॉडल के लिए मूल इनपुट बनाती हैं।
गेटेड रिकरेंट यूनिट
LSTM का एक सरलीकृत संस्करण जो कम पैरामीटर के साथ सूचना प्रवाह को नियंत्रित करने के लिए दो गेट (अपडेट और रीसेट) का उपयोग करता है। GRU कम्प्यूटेशनल रूप से अधिक कुशल होने के साथ-साथ LSTM के समान प्रदर्शन प्रदान करते हैं।
ग्रीडी सर्च
एक डिकोडिंग रणनीति जो प्रत्येक जेनरेशन चरण में निरंतर रूप से उच्चतम संभावना वाले टोकन का चयन करती है। हालांकि तेज़, यह दृष्टिकोण अपूर्ण समाधान की ओर ले जा सकता है क्योंकि यह वैकल्पिक अनुक्रमों पर विचार नहीं करता है।
द्वि-दिशात्मकता
इनकोडर की संपूर्ण संदर्भ को कैप्चर करने के लिए इनपुट अनुक्रम को दोनों दिशाओं (आगे और पीछे) में संसाधित करने की क्षमता। द्वि-दिशात्मक इनकोडर पिछले और भविष्य के संदर्भ दोनों पर विचार करके अर्थगत समझ में सुधार करते हैं।
उप-शब्द एम्बेडिंग
एक टोकनाइजेशन तकनीक जो दुर्लभ शब्दों और खुले शब्दावली को प्रबंधित करने के लिए शब्दों को छोटी रूपविज्ञान इकाइयों में विभाजित करती है। BPE या WordPiece जैसे उप-शब्द एम्बेडिंग आधुनिक मॉडल में मानक बन गए हैं।