एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
A/B Testing
एक प्रयोगात्मक पद्धति जो किसी मॉडल या सेवा के दो संस्करणों (A और B) की तुलना करती है ताकि यह निर्धारित किया जा सके कि पूर्व-निर्धारित मेट्रिक्स के अनुसार कौन सा संस्करण बेहतर प्रदर्शन करता है, आमतौर पर ट्रैफिक का यादृच्छिक वितरण के माध्यम से।
Multivariate Testing
एक उन्नत तकनीक जो कई चरों और उनके संयोजनों का एक साथ परीक्षण करके समग्र अनुकूलन की पहचान करती है, जिससे मॉडल के विभिन्न कारकों के बीच अंतःक्रिया का मूल्यांकन करने की अनुमति मिलती है।
Blue-Green Deployment
एक डिप्लॉयमेंट पैटर्न जिसमें दो समान वातावरण होते हैं, जहाँ पूर्ण सत्यापन के बाद ट्रैफिक पूरी तरह से पुराने संस्करण (ब्लू) से नए संस्करण (ग्रीन) पर स्विच हो जाता है, जिससे डाउनटाइम को कम किया जाता है।
Feature Flag
एक नियंत्रण तंत्र जो बिना रीडिप्लॉय के विशिष्ट सुविधाओं या मॉडलों को गतिशील रूप से सक्षम/अक्षम करने की अनुमति देता है, जिससे प्रयोगों और तेज़ रोलबैक को सुविधाजनक होता है।
Traffic Splitting
एक बुद्धिमान रूटिंग तकनीक जो A/B परीक्षणों या प्रगतिशील डिप्लॉयमेंट के लिए कॉन्फ़िगर करने योग्य नियमों के अनुसार अनुरोधों को मॉडल के विभिन्न संस्करणों के बीच आनुपातिक रूप से वितरित करती है।
Statistical Significance
एक प्रायिकता माप जो यह निर्धारित करता है कि परीक्षण किए गए वेरिएंट के बीच देखे गए अंतर वास्तविक प्रभावों के कारण हैं या आकस्मिक रूप से, आमतौर पर p-value < 0.05 के थ्रेशोल्ड के साथ।
P-value
यदि शून्य परिकल्पना सत्य होती, तो कम से कम उतने ही चरम परिणामों को प्राप्त करने की प्रायिकता, जो परिकल्पना परीक्षण में निर्णय लेने के मानदंड के रूप में काम करती है।
Confidence Interval
अनुमानित मूल्यों की एक सीमा जिसमें एक परिभाषित प्रायिकता (आमतौर पर 95%) के साथ मापे गए पैरामीटर का वास्तविक मूल्य होता है, जो प्रयोगात्मक अनुमानों की अनिश्चितता को मात्रांकित करती है।
Control Group
आबादी का एक नमूना जो संदर्भ संस्करण (आमतौर पर वर्तमान मॉडल) प्राप्त करता है और प्रयोगात्मक वेरिएंट के साथ सांख्यिकीय तुलना के लिए आधार रेखा के रूप में काम करता है।
Treatment Group
आबादी का एक खंड जो परीक्षण किए जा रहे मॉडल या उपचार के प्रयोगात्मक वेरिएंट के लिए उजागर किया जाता है, जिससे नियंत्रण समूह के सापेक्ष सापेक्ष प्रभाव को मापने की अनुमति मिलती है।
Baseline Model
एक संदर्भ मॉडल जिसका उपयोग तुलना बिंदु के रूप में किया जाता है ताकि नए संस्करणों द्वारा लाए गए सुधारों का मूल्यांकन किया जा सके, अक्सर यह वर्तमान में उत्पादन में रहने वाला मॉडल होता है।
Champion-Challenger
एक निरंतर प्रतिस्पर्धा रणनीति जहां वर्तमान चैंपियन मॉडल को लगातार चैलेंजर मॉडल द्वारा चुनौती दी जाती है, और सबसे अच्छा प्रदर्शन करने वाला मॉडल धीरे-धीरे चैंपियन को बदल देता है।
Progressive Rollout
किसी नए मॉडल का तेजी से बढ़ते ट्रैफिक प्रतिशत के साथ चरणबद्ध तैनाती, जो निरंतर सत्यापन और नकारात्मक प्रभाव के जोखिम को कम करने की अनुमति देती है।
Experimentation Platform
एक केंद्रीकृत बुनियादी ढांचा जो प्रयोगों के पूरे जीवनचक्र का प्रबंधन करता है, जिसमें वेरिएंट बनाने से लेकर परिणामों के सांख्यिकीय विश्लेषण और निर्णयों के स्वचालन तक शामिल है।
Metric Drift
उत्पादन में एक मॉडल के प्रदर्शन मेट्रिक्स में धीरे-धीरे गिरावट की घटना, जिसका पता निरंतर निगरानी के माध्यम से लगाया जाता है और जिसके लिए आवधिक पुनर्मूल्यांकन की आवश्यकता होती है।
Sample Size Calculation
एक सांख्यिकीय प्रक्रिया जो यह निर्धारित करती है कि किसी दिए गए सांख्यिकीय शक्ति के साथ एक महत्वपूर्ण अंतर का पता लगाने के लिए न्यूनतम कितनी अवलोकनों की आवश्यकता है, जो परीक्षणों की योजना के लिए आवश्यक है।
बेयेसियन A/B परीक्षण
वैकल्पिक दृष्टिकोण जो बेयेसियन प्रायिकताओं का उपयोग करके वेरिएंट्स का मूल्यांकन करता है, जिससे छोटे नमूनों के साथ निरंतर निर्णय लेने और परिणामों की तार्किक व्याख्या की अनुमति मिलती है।
अनुक्रमिक परीक्षण
पूर्वनिर्धारित अंतराल पर परिणामों का मूल्यांकन करने की अनुमति देने वाली विश्लेषण पद्धति, जो टाइप I त्रुटि के जोखिम में वृद्धि के बिना, प्रयोगों की अवधि और लागत को अनुकूलित करती है।