एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
निर्णय वृक्ष
मॉडल प्रेडिक्टिफ़ सुपरविज़े जो डेटा की विशेषताओं पर एक श्रृंखला के परीक्षण के माध्यम से निर्णय और उनके संभावित परिणामों को मॉडल करने के लिए एक वृक्ष संरचना का उपयोग करता है।
रूट नोड
निर्णय वृक्ष का प्रारंभिक बिंदु जो पूर्ण डेटा प्रशिक्षण सेट का प्रतिनिधित्व करता है और सबसे विशिष्ट विशेषता पर आधारित पहली विभाजन शामिल है।
आंतरिक नोड
निर्णय वृक्ष में एक मध्यवर्ती नोड जो एक विशिष्ट विशेषता पर एक परीक्षण का प्रतिनिधित्व करता है और डेटा को समान उप-समूहों में विभाजित करता है।
पत्ती
निर्णय वृक्ष का अंतिम नोड जो अंतिम निर्णय या कक्षा की भविष्यवाणी का प्रतिनिधित्व करता है, बिना किसी आगे विभाजन की संभावना के।
विभाजन मानदंड
एक मात्रात्मक पद्धति जो निर्णय वृक्ष में एक विभाजन की गुणवत्ता का मूल्यांकन करने के लिए उपयोग की जाती है, जिसका उद्देश्य परिणामी उप-समूहों की समानता को अधिकतम करना है।
एन्ट्रॉपी
डेटा सेट में विशृंखला या अनिश्चितता की एक गणितीय माप, जिसका उपयोग निर्णय वृक्ष में एक नोड की अशुद्धि को मापने के लिए किया जाता है।
सूचना लाभ
एक मेट्रिक जो एक विशिष्ट विशेषता के अनुसार एक नोड को विभाजित करके प्राप्त एन्ट्रॉपी में कमी को मापती है, जिसका उपयोग सर्वोत्तम विभाजन का चयन करने के लिए किया जाता है।
गिनी इंडेक्स
0 और 1 के बीच भिन्न होने वाली अशुद्धि का माप, जो गणना करती है कि एक यादृच्छिक रूप से चुना गया तत्व गलत वर्गीकृत होने की संभावना है, निर्णय वृक्ष में एन्ट्रॉपी का विकल्प।
काट-छांट
निर्णय पेड़ की जटिलता को कम करने की एक तकनीक जिसमें उन शाखाओं को हटाया जाता है जो अधिसीखन से बचने के लिए कम भविष्यवाणी शक्ति प्रदान करती हैं।
अधिसीखन
एक ऐसी घटना जहां एक मॉडल नए डेटा पर सामान्यीकरण की क्षमता के खर्च पर प्रशिक्षण डेटा के विवरण और शोर को अत्यधिक सीखता है।
पेड़ की गहराई
जड़ नोड से लेकर पत्ती तक विभाजन की अधिकतम संख्या, मॉडल की जटिलता और पूर्वाग्रह को नियंत्रित करने वाला एक महत्वपूर्ण पैरामीटर।
कार्ट
क्लासिफिकेशन एंड रिग्रेशन ट्रीज एल्गोरिथ्म जो वर्गीकरण के लिए विभाजन मानदंड के रूप में गिनी सूचकांक का उपयोग करके बाइनरी पेड़ बनाता है।
आईडी3
निर्णय पेड़ों का एक अग्रणी एल्गोरिथ्म जो विभाजन मानदंड के रूप में सूचना लाभ का उपयोग करता है, जो केवल श्रेणीबद्ध चर और बाइनरी विभाजन तक सीमित है।
सी4.5
आईडी3 एल्गोरिथ्म का एक सुधार जो कई मानों वाली विशेषताओं के प्रति पूर्वाग्रह से बचने के लिए सूचना लाभ अनुपात का उपयोग करता है।
लक्ष्य चर
पर्यवेक्षित शिक्षण समस्या में भविष्यवाणी करने के लिए चर, जिसे निर्णय पेड़ की अंतिम पत्तियों द्वारा दर्शाया जाता है।
निर्णय नियम
निर्णय पेड़ में एक पथ से निकाले गए IF-THEN शर्तों का एक तार्किक समूह, जो मॉडल की भविष्यवाणियों की व्याख्या और स्पष्टीकरण की अनुमति देता है।
चरों का महत्व
प्रत्येक भविष्यवाणी विशेषता के योगदान का मात्रात्मक माप जो पूरे पेड़ में विभाजनों की शुद्धता में सुधार करता है।
जटिलता की लागत
प्रूनिंग पैरामीटर जो पेड़ के आकार को दंडित करता है, डेटा के अनुकूलन और मॉडल की सरलता के बीच संतुलन बनाकर सामान्यीकरण को अनुकूलित करता है।