एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
चरम मूल्य सिद्धांत
सांख्यिकी की वह शाखा जो वितरण के चरम मूल्यों के सीमांत व्यवहार का अध्ययन करती है, जो बड़े परिमाण की दुर्लभ घटनाओं को मॉडल और पूर्वानुमानित करने में सक्षम बनाती है।
मजबूत सांख्यिकी
सांख्यिकीय विधियों का समूह जो धारणाओं के उल्लंघन और चरम मूल्यों के प्रति प्रतिरोधी है, जो दूषित डेटा की उपस्थिति में भी विश्वसनीय अनुमान प्रदान करता है।
विंसोराइजेशन
सांख्यिकीय परिवर्तन की तकनीक जो चरम मूल्यों को निर्दिष्ट क्वांटाइल से प्रतिस्थापित करती है, जिससे विश्लेषण पर बहिर्गत अवलोकनों के प्रभाव को सीमित किया जाता है।
कुक की दूरी
रिग्रेशन में प्रभाव का माप जो उन अवलोकनों की पहचान करता है जिनका अनुमानित मॉडल पैरामीटर पर असमान प्रभाव होता है, जो लीवरेज और अवशेषों के प्रभाव को संयोजित करता है।
लीवरेज बिंदु
चरम पूर्वानुमान मूल्यों वाले अवलोकन जो रिग्रेशन गुणांक पर अत्यधिक प्रभाव डाल सकते हैं, भले ही वे अपेक्षित मॉडल का अनुसरण करते हों।
ब्रेकडाउन बिंदु
दूषित डेटा की न्यूनतम अनुपात जिसे एक सांख्यिकीय अनुमानक मनमाने ढंग से गलत परिणाम देने से पहले सहन कर सकता है, जो किसी विधि की मजबूती को मापता है।
डीबीस्कैन क्लस्टरिंग
घनत्व-आधारित क्लस्टरिंग एल्गोरिदम जो मनमाने आकार के क्लस्टर और शोर बिंदुओं को चरम मूल्यों के रूप में स्वचालित रूप से पहचानने में सक्षम है।
ग्रब्स परीक्षण
सामान्य रूप से वितरित डेटा में एकल बहिर्गत मूल्य का पता लगाने के लिए एक पैरामीट्रिक सांख्यिकीय परीक्षण, जो मानक विचलन पर आधारित है।
चरम प्रतिशतक विधि
वितरण के ऊपरी या निचले प्रतिशतकों के आधार पर चरम मूल्यों की पहचान करने वाला दृष्टिकोण, आमतौर पर 1% या 5% चरम मूल्यों को सीमा के रूप में उपयोग करता है।
माध्यिका निरपेक्ष विचलन
निरपेक्ष माध्यिका विचलन से गणना की गई फैलाव की मजबूत माप, चरम मूल्यों के प्रति प्रतिरोधी और मानक विचलन का विकल्प।
प्रभावशाली अवलोकन
डेटा बिंदु जिनकी उपस्थिति या अनुपस्थिति सांख्यिकीय विश्लेषण के परिणामों को महत्वपूर्ण रूप से बदल देती है, कुक की दूरी जैसे मापों द्वारा पता लगाया जाता है।
ट्यूकी की सीमाएं
चरम मूल्यों का पता लगाने की विधि जो इंटरक्वार्टाइल रेंज पर आधारित सीमाओं का उपयोग करती है, आमतौर पर मध्यम मूल्यों के लिए 1.5*IQR और चरम मूल्यों के लिए 3*IQR।
चौवेनेट का मानदंड
क्लासिक सांख्यिकीय परीक्षण जो एक मान ली गई सामान्य वितरण में एक अवलोकन की घटना की संभावना के आधार पर आउटलायर्स की पहचान करता है।