एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
यादृच्छिक निर्णय वृक्ष
यादृच्छिक रूप से उत्पन्न पेड़ की संरचना जहां प्रत्येक नोड यादृच्छिक विभाजन के अनुसार विशेषता स्थान को विभाजित करता है, जो धीरे-धीरे अवलोकनों को अलग करने वाले विभाजन बनाता है।
असामान्यता स्कोर
पेड़ में पथ की लंबाई से गणना की गयी मात्रात्मक मेट्रिक, जो एक अवलोकन की असामान्यता की डिग्री को इंगित करती है जहां उच्च स्कोर असामान्यता होने की उच्च संभावना के अनुरूप होता है।
अलगाव पथ
मूल से लेकर एक अवलोकन को धारण करने वाले पत्ते तक आवश्यक विभाजनों की संख्या, जहां असामान्यताएँ सामान्य बिंदुओं की तुलना में काफी छोटे पथ प्रस्तुत करती हैं।
संदूषण कारक
डेटासेट में असामान्यताओं की अपेक्षित अनुपात का अनुमान लगाने वाला महत्वपूर्ण पैरामीटर, आमतौर पर 0.01 और 0.1 के बीच, वर्गीकरण सीमा को प्रभावित करता है।
औसत पथ लंबाई
असंरचित डेटा के लिए अलगाव पथ की अपेक्षित सैद्धांतिक मान, अंतिम गणना में असामान्यता स्कोर को सामान्य करने के लिए संदर्भ के रूप में उपयोग किया जाता है।
यादृच्छिक विशेषता विभाजन
प्रत्येक नोड पर एक विशेषता और विभाजन मूल्य का यादृच्छिक चयन, विशेषता वितरण से संबंधित पूर्वाग्रहों से बचने और असामान्यताओं के अलगाव को बढ़ावा देने के लिए।
सामान्यता स्कोर
असामान्यता स्कोर का एक सामान्यीकृत पैमाने पर रूपांतरण, अक्सर 0 और 1 के बीच, व्याख्या और विभिन्न मॉडलों या डेटासेट के बीच तुलना को सुविधाजनक बनाता है।
बिंदु असामान्यता
एक व्यक्तिगत अवलोकन जो डेटा के अपेक्षित व्यवहार से काफी भिन्न है, एल्गोरिथ्म में अपनी छोटी अलगाव पथ लंबाई द्वारा आसानी से पहचाना जा सकता है।
पुनरावर्ती विभाजन
डेटा स्थान को बढ़ते हुए छोटे उप-क्षेत्रों में विभाजित करने की पुनरावर्ती प्रक्रिया, जो एक पदानुक्रमित संरचना बनाती है जो असामान्य अवलोकनों को प्रभावी ढंग से अलग करती है।
पहचान सीमा
संदूषण कारक द्वारा निर्धारित सीमा मूल्य जो सामान्य अवलोकनों को विसंगतियों से अलग करता है, जिसकी गणना डेटासेट पर विसंगति स्कोर के वितरण से की जाती है।
आवरण बॉक्स
प्रत्येक वृक्ष विभाजन पर बनाया गया बहुआयामी हाइपर-आयत, जो विभाजन की सीमाएं निर्धारित करता है और अलगाव पथों की गणना को प्रभावी ढंग से सक्षम बनाता है।
विसंगति स्थानीकरण कारक
स्थानीय घनत्व पर आधारित विसंगति पहचान का वैकल्पिक मेट्रिक, जिसकी अक्सर आइसोलेशन फॉरेस्ट के साथ तुलना की जाती है ताकि विभिन्न प्रकार के डेटा वितरण पर प्रदर्शन का मूल्यांकन किया जा सके।
वृक्ष काटना
वृक्षों के विकास को सीमित करने की तकनीक, जब नोड्स में केवल एक नमूना होता है या अधिकतम गहराई तक पहुँच जाती है, तो विभाजन को रोककर, गणना समय को अनुकूलित किया जाता है।