एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
वास्तविक सकारात्मक (TP)
एक सही परिणाम जहां मॉडल एक ऐसे अवलोकन को सकारात्मक रूप से भविष्यवाणी करता है जो वास्तव में सकारात्मक है, जो रुचि की वर्ग का सफल वर्गीकरण दर्शाता है। वास्तविक सकारात्मकों की संख्या मॉडल की प्रासंगिक मामलों को सही ढंग से पहचानने की क्षमता का मूल्यांकन करने के लिए महत्वपूर्ण है।
गलत सकारात्मक (FP)
वर्गीकरण त्रुटि जहां मॉडल एक अवलोकन को गलत तरीके से सकारात्मक के रूप में भविष्यवाणी करता है जबकि यह वास्तव में नकारात्मक है, जो एक झूठी अलार्म से मेल खाता है। गलत सकारात्मक विशेष रूप से चिकित्सा निदान या धोखाधड़ी का पता लगाने जैसे क्षेत्रों में महंगे होते हैं।
परिशुद्धता (Precision)
वास्तविक सकारात्मकों और गलत सकारात्मकों के योग पर वास्तविक सकारात्मकों के अनुपात के रूप में गणना की गई मेट्रिक, जो सभी सकारात्मक भविष्यवाणियों में से सही सकारात्मक भविष्यवाणियों के अनुपात को मापती है। यह विशेष रूप से महत्वपूर्ण है जब गलत सकारात्मकों की लागत उच्च होती है।
रिकॉल (Recall)
जिसे संवेदनशीलता भी कहा जाता है, यह वास्तविक सकारात्मकों और गलत नकारात्मकों के योग पर वास्तविक सकारात्मकों का अनुपात मापता है, जो मॉडल की सभी वास्तविक सकारात्मक अवलोकनों की पहचान करने की क्षमता का मूल्यांकन करता है। रिकॉल तब महत्वपूर्ण होता है जब गलत नकारात्मकों के गंभीर परिणाम होते हैं।
आरओसी वक्र (ROC Curve)
एक ग्राफ जो विभिन्न वर्गीकरण सीमाओं के लिए वास्तविक सकारात्मक दर को गलत सकारात्मक दर के फलन के रूप में दर्शाता है, जो संवेदनशीलता और विशिष्टता के बीच समझौते को चित्रित करता है। इस वक्र के नीचे का क्षेत्र (AUC) वर्गीकारक की समग्र प्रदर्शन को मात्रात्मक रूप देता है।
लॉजिस्टिक रिग्रेशन (Logistic Regression)
एक सामान्यीकृत रेखीय मॉडल जो द्विआधारी वर्गीकरण में निरंतर भविष्यवाणियों को 0 और 1 के बीच संभावना में मैप करने के लिए सिग्मॉइड फ़ंक्शन का उपयोग करता है। यह व्याख्या योग्य मॉडल अक्सर द्विआधारी वर्गीकरण समस्याओं के लिए बेसलाइन के रूप में उपयोग किया जाता है।
निर्णय सीमा (Decision Threshold)
एक सीमा मूल्य (आमतौर पर 0.5) जिसका उपयोग आउटपुट संभावनाओं को द्विआधारी भविष्यवाणियों में बदलने के लिए किया जाता है, जिसके ऊपर अवलोकन को सकारात्मक के रूप में वर्गीकृत किया जाता है। इस सीमा को समायोजित करने से परिशुद्धता और रिकॉल के बीच समझौते को अनुकूलित करने की अनुमति मिलती है।
वर्ग असंतुलन (Class Imbalance)
एक स्थिति जहां प्रशिक्षण डेटासेट में एक वर्ग दूसरे की तुलना में महत्वपूर्ण रूप से अधिक प्रतिनिधित्व किया जाता है, जो मॉडल को बहुसंख्यक वर्ग की ओर पूर्वाग्रहित कर सकता है। इस समस्या को हल करने के लिए ओवरसैंपलिंग या क्लास वेटिंग जैसी विशिष्ट तकनीकों की आवश्यकता होती है।
SMOTE
कृत्रिम ओवरसैंपलिंग तकनीक जो मौजूदा उदाहरणों के बीच इंटरपोलेशन के माध्यम से अल्पसंख्यक वर्ग के नए उदाहरण उत्पन्न करती है, इस प्रकार वर्ग वितरण को बिना सटीक डुप्लिकेशन के संतुलित करती है। SMOTE असंतुलित डेटासेट पर प्रदर्शन में सुधार के लिए विशेष रूप से प्रभावी है।
बाइनरी डिसीजन ट्री
वर्गीकरण एल्गोरिथ्म जो विशेषता स्थान को शुद्ध क्षेत्रों में विभाजित करने के लिए बाइनरी निर्णयों की पदानुक्रमित संरचना का उपयोग करता है, प्रत्येक पत्ती एक पूर्वानुमानित वर्ग का प्रतिनिधित्व करती है। निर्णय वृक्ष उच्च व्याख्यात्मकता प्रदान करते हैं लेकिन ओवरफिटिंग के प्रति संवेदनशील होते हैं।
विशिष्टता
सच्चे नकारात्मक और झूठे सकारात्मक के योग पर सच्चे नकारात्मकों के अनुपात के रूप में गणना की गई माप, नकारात्मक अवलोकनों की सही पहचान करने के लिए मॉडल की क्षमता का मूल्यांकन करती है। विशिष्टता रिकॉल के पूरक है और स्क्रीनिंग टेस्ट में महत्वपूर्ण है।