एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
फ़ीचर चयन
सुपरवाइज्ड मॉडल के लिए सबसे प्रासंगिक फ़ीचर्स का स्वचालित रूप से चयन करने की प्रक्रिया, जिसमें रेडंडेंट या गैर-जानकारीपूर्ण वेरिएबल्स को हटाकर प्रदर्शन में सुधार और जटिलता को कम किया जाता है।
लेबल एन्कोडिंग
कैटेगोरिकल वेरिएबल्स को पूर्णांक संख्यात्मक मानों में रूपांतरण, जहां प्रत्येक अद्वितीय श्रेणी को एक विशिष्ट संख्यात्मक पहचानकर्ता प्राप्त होता है, जो संख्यात्मक इनपुट आवश्यक वाले एल्गोरिदम के लिए उपयुक्त है।
फ़ीचर स्केलिंग
संख्यात्मक फ़ीचर्स को एक तुलनात्मक रेंज में लाने के लिए नॉर्मलाइज़ेशन या स्टैंडर्डाइज़ेशन, जो SVM और न्यूरल नेटवर्क जैसे वेरिएबल स्केल के प्रति संवेदनशील एल्गोरिदम के लिए आवश्यक है।
बहुपदीय फ़ीचर्स
मौजूदा वेरिएबल्स के बहुपदीय संयोजन बनाकर नए फ़ीचर्स का निर्माण, जिससे फ़ीचर्स और टारगेट वेरिएबल के बीच गैर-रैखिक संबंधों को पकड़ा जा सकता है।
इंटरैक्शन फ़ीचर्स
मौजूदा फ़ीचर्स के बीच इंटरैक्शन का प्रतिनिधित्व करने वाले नए वेरिएबल्स का निर्माण, आमतौर पर गुणा या संयोजन द्वारा, ताकि सुपरवाइज्ड डेटा में सिनर्जिस्टिक प्रभावों का पता लगाया जा सके।
पुनरावर्ती फ़ीचर उन्मूलन
पुनरावर्ती चयन एल्गोरिदम जो एक मॉडल बनाता है, एक विशिष्ट मानदंड के अनुसार सबसे कम महत्वपूर्ण फ़ीचर्स को हटाता है, और इस प्रक्रिया को तब तक दोहराता है जब तक फ़ीचर्स की इष्टतम संख्या तक नहीं पहुंच जाता।
टारगेट एन्कोडिंग
कैटेगोरिकल वेरिएबल्स को ट्रांसफॉर्म करने की तकनीक, जिसमें प्रत्येक श्रेणी के लिए टारगेट वेरिएबल के आँकड़ों (माध्य, माध्यिका) का उपयोग किया जाता है, जिससे पूर्वानुमान के साथ संबंध को सीधे कैप्चर किया जा सकता है।
फ़ीचर महत्व
सुपरवाइज्ड मॉडल की पूर्वानुमानों पर प्रत्येक फ़ीचर के प्रभाव का मात्रात्मक माप, जिसकी गणना परम्यूटेशन इंपॉर्टेंस, SHAP वैल्यूज़ या मॉडल गुणांक जैसे तरीकों से की जाती है।
प्रिंसिपल कंपोनेंट एनालिसिस
एक रैखिक आयामी कमी तकनीक जो विशेषताओं को गैर-सहसंबंधित ऑर्थोगोनल घटकों में बदलती है, जिससे कम आयामों के साथ समझाए गए विचरण को अधिकतम किया जाता है।
बिनिंग/डिस्क्रेटाइजेशन
निरंतर चरों को असतत श्रेणियों (बिन्स) में बदलने की प्रक्रिया जिससे संबंधों को सरल बनाया जाता है, बाहरी मूल्यों को प्रबंधित किया जाता है और कुछ पर्यवेक्षित एल्गोरिदम के प्रदर्शन को बेहतर बनाया जाता है।
फीचर हैशिंग
एक कम आयामी तकनीक जो विशेषताओं पर एक हैशिंग फ़ंक्शन लागू करती है ताकि उन्हें एक निश्चित आयामी स्थान में मैप किया जा सके, जो बहुत सारी श्रेणियों के साथ उच्च-आयामी डेटा के लिए उपयोगी है।
अनुपस्थित मूल्य आबादी
विशेषताओं में अनुपस्थित मूल्यों को उपयुक्त अनुमानों से बदलने के लिए सांख्यिकीय या एल्गोरिदमिक रणनीतियों का समूह, जो पर्यवेक्षित डेटा की अखंडता बनाए रखने के लिए आवश्यक है।
फीचर क्रॉसेस
विशिष्ट इंटरैक्शन का प्रतिनिधित्व करने वाली नई फीचर्स बनाने के लिए विशेषताओं का संयोजन, विशेष रूप से गैर-एडिटिव संबंधों को कैप्चर करने के लिए रैखिक मॉडल में प्रभावी।
फीचर इंजीनियरिंग पाइपलाइन
विशेषताओं पर लागू होने वाले परिवर्तनों का एक स्वचालित और पुनरुत्पादनीय क्रम, जो प्रशिक्षण और भविष्यवाणी के बीच निरंतरता सुनिश्चित करने के लिए सफाई, निर्माण, चयन और स्केलिंग को एकीकृत करता है।
डोमेन-स्पेसिफिक फीचर क्रिएशन
व्यावसायिक विशेषज्ञता और डोमेन ज्ञान के आधार पर विशेषताओं का विकास, जो कच्चे डेटा में स्पष्ट नहीं विशिष्ट पैटर्न को कैप्चर करने वाले सूचनात्मक चर बनाता है।
टेम्पोरल फीचर इंजीनियरिंग
लैग फीचर्स, रोलिंग स्टैटिस्टिक्स, टाइम कंपोनेंट्स और सीज़नल ट्रेंड्स जैसे समय-विशिष्ट डेटा के लिए विशेषताओं का निर्माण, कालानुक्रमिक पर्यवेक्षित भविष्यवाणियों को बेहतर बनाने के लिए।