एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
मिन-मैक्स सामान्यीकरण
स्केलिंग तकनीक जो मानों को एक विशिष्ट सीमा (आमतौर पर [0, 1]) में बदलती है, सूत्र (x - min) / (max - min) का उपयोग करके अवलोकनों के बीच सापेक्ष संबंधों को संरक्षित करती है।
जेड-स्कोर मानकीकरण
केंद्रित-कम किया गया परिवर्तन जो माध्य घटाता है और मानक विचलन से विभाजित करता है, जिसके परिणामस्वरूप माध्य 0 और मानक विचलन 1 का वितरण होता है, जो चरों की तुलना करने योग्य बनाता है।
बॉक्स-कॉक्स परिवर्तन
पैरामीट्रिक परिवर्तन जो सकारात्मक डेटा पर एक अनुकूलित शक्ति λ लागू करता है, विचरण को स्थिर करने और वितरण को सामान्य बनाने के लिए, विशेष रूप से दाईं ओर तिरछे डेटा के लिए प्रभावी।
येओ-जॉनसन परिवर्तन
बॉक्स-कॉक्स का विस्तार जो नकारात्मक और शून्य मानों को संभालता है, वितरणों को सामान्य बनाते हुए व्याख्यात्मकता को संरक्षित करने के लिए x के चिन्ह के आधार पर विभिन्न सूत्रों का उपयोग करता है।
लघुगणकीय परिवर्तन
स्केल को संकुचित करने, विषमता को कम करने और गुणात्मक संबंधों को योगात्मक में बदलने के लिए एक लघुगणक फ़ंक्शन (आमतौर पर प्राकृतिक या आधार 10) का अनुप्रयोग।
क्वांटाइल परिवर्तन
गैर-पैरामीट्रिक मैपिंग जो चरों को एक विशिष्ट वितरण (समान या गाऊसी) का पालन करने के लिए बदलता है, अनुभवजन्य क्वांटाइल का उपयोग करके, चरम मूल्यों के प्रति मजबूत।
रोबस्ट स्केलर
स्केलिंग विधि जो माध्य और मानक विचलन के बजाय माध्यिका और इंटरक्वार्टाइल रेंज (IQR) का उपयोग करती है, आउटलायर्स और गैर-गाऊसी वितरणों के प्रति प्रतिरोधी।
विंसोराइजेशन
चरम मूल्यों को सीमित करने की तकनीक जो कुछ क्वांटाइल (आमतौर पर पहला और 99वां प्रतिशतक) से परे अवलोकनों को उन सीमा मूल्यों से बदलकर आउटलायर्स के प्रभाव को कम करती है।
वर्गमूल परिवर्तन
√x परिवर्तन का अनुप्रयोग दाईं ओर की विषमता को कम करने के लिए, विशेष रूप से गणना डेटा या पॉइसन वितरण का पालन करने वाले चर के लिए उपयोगी।
यूनिट वेक्टर स्केलिंग
सामान्यीकरण जो प्रत्येक वेक्टर को उसके यूक्लिडियन मान द्वारा विभाजित करके इकाई परिमाण प्राप्त करता है, आमतौर पर टेक्स्ट प्रोसेसिंग और समानता विश्लेषण में उपयोग किया जाता है।
आर्कसाइन परिवर्तन
अनुपात या संभावनाओं पर arcsin(√x) का अनुप्रयोग विचरण को स्थिर करने और 0 और 1 के बीच सीमित वितरणों को सामान्य करने के लिए, विशेष रूप से मेटाजेनेटिक्स और पारिस्थितिकी में।
दशमलव स्केलिंग
सामान्यीकरण की विधि जो मानों को 10 की घात (10^j) से विभाजित करती है जहाँ j सबसे छोटा पूर्णांक है जैसे कि max(|x|/10^j) < 1, संकेतों और आनुपातिक संबंधों को संरक्षित करती है।
व्युत्क्रम परिवर्तन
1/x फ़ंक्शन का अनुप्रयोग दाईं ओर लंबी पूंछ वाले वितरणों को बदलने के लिए, विशेष रूप से दरों या अनुपातों का प्रतिनिधित्व करने वाले चर के लिए प्रभावी।
पावर परिवर्तन
x^λ परिवर्तनों का परिवार जहाँ λ एक समायोज्य पैरामीटर है, जिसमें वर्गमूल (λ=0.5), वर्ग (λ=2) और अन्य गैर-रैखिक संबंधों को मॉडल करने के लिए परिवर्तन शामिल हैं।
क्लिपिंग
पूर्वनिर्धारित अंतराल में मानों को सीमित करना, चरम मानों को ऊपरी या निचली सीमाओं से बदलकर, आउटलायर्स के उपचार के लिए विंसोराइजेशन का एक सरल विकल्प।
अनुकूली बिनिंग
विभाजन जो डेटा वितरण (क्वांटाइल) या सांख्यिकीय मानदंडों के आधार पर परिवर्तनशील चौड़ाई वाले बिन बनाता है, सतत डेटा की स्थानीय संरचनाओं को बेहतर ढंग से कैप्चर करता है।
साइनसॉइडल परिवर्तन
समय श्रृंखला डेटा में चक्रीय या आवधिक पैटर्न को पकड़ने के लिए त्रिकोणमितीय फलनों का अनुप्रयोग, जो रैखिक संबंधों को दोलनशील व्यवहार में बदलता है।