एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
प्रिसिजन@K
मेट्रिक जो K पहली सिफारिशों में संबंधित आइटम्स के अनुपात को मापती है, शीर्ष रैंक किए गए परिणामों की गुणवत्ता का मूल्यांकन करने के लिए आवश्यक है।
रिकॉल@K
संकेतक जो पहली K सिफारिशों में वास्तव में मौजूद संबंधित आइटम्स का अनुपात गणना करता है, उपलब्ध कुल संबंधित आइटम्स की तुलना में।
मीन एवरेज प्रिसिजन (MAP)
समग्र मेट्रिक जो प्रत्येक संबंधित स्थान पर प्रिसिजन के औसत की गणना करती है, सिफारिश सूची में प्रत्येक संबंधित आइटम की रैंक द्वारा भारित।
एनडीसीजी (नॉर्मलाइज्ड डिस्काउंटेड क्यूमुलेटिव गेन)
नॉर्मलाइज्ड स्कोर जो रैंकिंग गुणवत्ता का मूल्यांकन करता है, सूची के शुरुआत से दूर रखे गए संबंधित आइटम्स पर पेनल्टी लगाकर, स्नातक प्रासंगिकता के साथ सिफारिशों के लिए आदर्श।
आरएमएसई (रूट मीन स्क्वेयर एरर)
मीन स्क्वेयर एरर जो रेटिंग भविष्यवाणियों की सटीकता का मूल्यांकन करने के लिए उपयोग किया जाता है, भविष्यवाणी और वास्तविक मूल्यों के बीच अंतर को मापकर।
हिट रेट (HR)
सत्रों का प्रतिशत जहां कम से कम एक संबंधित आइटम पहली N सिफारिशों में दिखाई देता है, सिस्टम की समग्र प्रभावशीलता को मापता है।
कैटलॉग कवरेज
कैटलॉग से अद्वितीय आइटम्स का प्रतिशत जो सिस्टम द्वारा अनुशंसित किया जा सकता है, आइटम्स के एक सीमित सबसेट पर ध्यान केंद्रित करने से बचने के लिए महत्वपूर्ण।
इंट्रा-लिस्ट डायवर्सिटी
एक ही सिफारिश सूची में आइटम्स के बीच औसत भिन्नता का माप, अतिरिक्तता से बचने और उपयोगकर्ता अनुभव को समृद्ध करने के लिए आवश्यक।
नवीनता
उपयोगकर्ता के लिए अनुशंसित वस्तुओं की अज्ञातता की डिग्री, जिसे कैटलॉग में उनकी समग्र लोकप्रियता के व्युत्क्रम के रूप में गणना की जाती है।
आकस्मिक खोज
सिस्टम की क्षमता जो सरल पूर्वानुमानों से परे जाकर ऐसे वस्तुओं की अनुशंसा करती है जो प्रासंगिक लेकिन अप्रत्याशित हों और उपयोगकर्ता को सकारात्मक रूप से आश्चर्यचकित करें।
ए/बी परीक्षण
एक प्रायोगिक प्रक्रिया जो व्यावसायिक प्रभाव को मापने के लिए वास्तविक उपयोगकर्ता खंडों पर सिस्टम के दो संस्करणों के प्रदर्शन की तुलना करती है।
लीव-वन-आउट क्रॉस-वेलिडेशन
एक मजबूत मूल्यांकन तकनीक जहां प्रत्येक उपयोगकर्ता इंटरैक्शन को बारी-बारी से टेस्ट डेटा के रूप में उपयोग किया जाता है, जबकि अन्य प्रशिक्षण के लिए काम करते हैं।
ऑफलाइन बनाम ऑनलाइन मूल्यांकन
एक द्वैत दृष्टिकोण जो ऐतिहासिक डेटा (ऑफलाइन) और वास्तविक इंटरैक्शन (ऑनलाइन) पर प्रदर्शन का मूल्यांकन करके सिस्टम की पूरी प्रभावशीलता को सत्यापित करता है।
अस्थायी सामान्यीकरण
सिस्टम की क्षमता जो भविष्य के डेटा पर अपना प्रदर्शन बनाए रखे, जिसका मूल्यांकन यादृच्छिक के बजाय अस्थायी विभाजनों पर अनुक्रमिक रूप से किया जाता है।
व्यावसायिक मेट्रिक्स सहसंबंध
एल्गोरिदमिक मेट्रिक्स (NDCG, Precision) और व्यावसायिक संकेतकों (रूपांतरण, प्रतिधारण) के बीच संबंध का विश्लेषण व्यापारिक प्रासंगिकता को सत्यापित करने के लिए।
कैटरैक्ट मेट्रिक
अनुशंसाओं की गुणवत्ता को समग्र रूप से मूल्यांकन करने के लिए सटीकता, विविधता, नवीनता और कवरेज को संतुलित करने वाला एक समग्र स्कोर।
अपेक्षित पारस्परिक रैंक (ERR)
उपयोगकर्ता व्यवहार पर आधारित प्रायिकता मॉडल जो मानता है कि पहले क्लिक के बाद जांच रुक जाती है, और पहली स्थितियों को अधिक वेट देता है।
उपयोगकर्ता कवरेज
उन उपयोगकर्ताओं का प्रतिशत जिनके लिए सिस्टम अनुशंसाएं उत्पन्न कर सकता है, सिस्टम की सार्वभौमिक लागूप्रभाविता मापने के लिए महत्वपूर्ण।
निष्पक्षता मेट्रिक्स
एल्गोरिदमिक पूर्वाग्रहों से बचने के लिए विभिन्न जनसांख्यिकीय समूहों के बीच अनुशंसाओं के वितरण की निष्पक्षता का मूल्यांकन करने वाले संकेतक।
एक्सपोजर बायस माप
लोकप्रिय और लॉन्ग-टेल आइटम्स के बीच एक्सपोजर की विषमता का मात्रात्मक निर्धारण, अनुशंसाओं के संतुलन का मूल्यांकन करने के लिए आवश्यक।