एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
रोबस्ट स्केलिंग
आउटलायर्स के प्रति प्रतिरोधी तकनीक जो क्वांटाइल का उपयोग करती है, आमतौर पर (x - माध्यिका)/IQR लागू करती है जहां IQR इंटरक्वार्टाइल रेंज को दर्शाता है। यह दृष्टिकोण शोर या चरम डेटा की उपस्थिति में भी परिवर्तनों की स्थिरता बनाए रखता है।
L1 सामान्यीकरण
स्केलिंग विधि जो वेक्टर में सभी मानों के पूर्ण योग से प्रत्येक मान को विभाजित करती है, यह सुनिश्चित करती है कि L1 मानदंड 1 के बराबर हो। यह परिवर्तन संभाव्यता-आधारित मॉडल और विरल प्रतिनिधित्व के लिए विशेष रूप से उपयोगी है।
L2 सामान्यीकरण
वैक्टर को सामान्य करने की प्रक्रिया जो प्रत्येक घटक को वर्गों के योग के वर्गमूल से विभाजित करती है, एक इकाई यूक्लिडियन मानदंड सुनिश्चित करती है। यह तकनीक वेक्टर परिमाण के प्रति संवेदनशील एल्गोरिदम जैसे SVM और न्यूरल नेटवर्क के लिए आवश्यक है।
क्वांटाइल सामान्यीकरण
गैर-पैरामीट्रिक तकनीक जो डेटा को क्वांटाइल संचयी वितरण कार्यों का उपयोग करके एक निर्दिष्ट समान या सामान्य वितरण का पालन करने के लिए परिवर्तित करती है। यह दृष्टिकोण दृढ़ता से विषम या मल्टीमोडल वितरणों को संभालने के लिए विशेष रूप से प्रभावी है।
यूनिट वेक्टर स्केलिंग
सामान्यीकरण जो प्रत्येक वेक्टर को उसके यूक्लिडियन मानदंड से विभाजित करता है, जिससे बहुआयामी स्थान में इकाई लंबाई के वेक्टर प्राप्त होते हैं। यह विधि कोसाइन समानता माप और पाठ्य प्रतिनिधित्व पर आधारित एल्गोरिदम के लिए महत्वपूर्ण है।
दशमलव सामान्यीकरण
सरल तकनीक जो मानों को 10 की घात से विभाजित करके उन्हें [-1,1] अंतराल में लाती है, जो दशमलव से पहले अंकों की अधिकतम संख्या पर आधारित है। यह विधि सापेक्ष परिमाण क्रम को संरक्षित करते हुए पूर्ण संख्यात्मक पैमाने को कम करती है।
रोबस्ट मानकीकरण
मानकीकरण का एक प्रकार जो केंद्रीय प्रवृत्ति और फैलाव के माप के रूप में माध्यिका और माध्यिका से पूर्ण विचलन (MAD) का उपयोग करता है, जो आउटलायर्स के प्रति बढ़ी हुई प्रतिरोधक क्षमता प्रदान करता है। यह दृष्टिकोण मजबूती सुनिश्चित करते हुए व्याख्यात्मकता बनाए रखता है।
लघुगणकीय स्केलिंग
परिवर्तन जो log(x + c) लागू करता है जहां c शून्य मानों को संभालने के लिए एक स्थिरांक है, बड़े मानों के पैमाने को प्रभावी ढंग से संपीड़ित करता है। यह विधि पावर लॉ का पालन करने वाले डेटा या दाएं-विषमता प्रस्तुत करने वाले डेटा के लिए विशेष रूप से उपयुक्त है।
रैंक सामान्यीकरण
गैर-पैरामीट्रिक तकनीक जो प्रत्येक मान को डेटासेट में उसके सामान्यीकृत रैंक से बदलती है, चरम मूल्यों के प्रभाव को समाप्त करती है। यह दृष्टिकोण आउटलायर्स के प्रति मजबूत है और केवल अवलोकनों के सापेक्ष क्रम को संरक्षित करता है।
माध्यिका मानकीकरण
डेटा को माध्य के बजाय माध्यिका के आसपास केंद्रित करने वाली विधि, जो इसे इंटरक्वार्टाइल रेंज जैसे मजबूत फैलाव माप से विभाजित करती है। यह दृष्टिकोण असममित वितरण और आउटलायर्स के प्रति बेहतर प्रतिरोध प्रदान करता है।
अधिकतम निरपेक्ष मान स्केलिंग
सरल तकनीक जो प्रत्येक मान को विशेषता के अधिकतम निरपेक्ष मान से विभाजित करती है, चिह्नों और शून्यों को संरक्षित करते हुए मूल्यों को [-1,1] में सीमित करती है। यह विधि पहले से केंद्रित या विरल डेटा के लिए विशेष रूप से प्रभावी है।
प्रसरण सामान्यीकरण
चरों को उनके प्रसरण से विभाजित करके मानकीकृत करने की प्रक्रिया, जिससे स्केल-संवेदी एल्गोरिदम में प्रत्येक विशेषता के महत्व को समान बनाया जाता है। यह दृष्टिकोण प्रमुख घटक विश्लेषण और रिज रिग्रेशन के लिए विशेष रूप से उपयोगी है।
परिवर्तनशीलता गुणांक मानकीकरण
उन्नत विधि जो डेटा को परिवर्तनशीलता गुणांक (σ/μ) से विभाजित करके सामान्यीकृत करती है, जो विभिन्न माध्य और प्रसरण वाले चरों की तुलना करने की अनुमति देती है। यह तकनीक उन डेटा के लिए विशेष रूप से प्रासंगिक है जहां सापेक्ष परिवर्तनशीलता निरपेक्ष परिवर्तनशीलता से अधिक महत्वपूर्ण है।