एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
A/B Testing for Models
मॉडल के लिए A/B परीक्षण, एक तुलनात्मक तैनाती तकनीक है जहाँ एक मॉडल के दो संस्करणों को वास्तविक स्थितियों में उनके सापेक्ष प्रदर्शन का मूल्यांकन करने के लिए अलग-अलग उपयोगकर्ता खंडों पर एक साथ परीक्षण किया जाता है।
Online Inference
रीयल-टाइम अनुमान लगाने का तरीका जहाँ मॉडल न्यूनतम लेटेंसी के साथ, आमतौर पर REST या gRPC API के माध्यम से, मांग पर व्यक्तिगत भविष्यवाणियों को संसाधित करता है।
Batch Inference
अनुमान लगाने का एक तरीका जहाँ भविष्यवाणियाँ नियमित अंतराल पर डेटा के बैचों के लिए उत्पन्न की जाती हैं, जो व्यक्तिगत लेटेंसी के बजाय थ्रूपुट के लिए अनुकूलित होता है।
Serverless Inference
तैनाती का एक आर्किटेक्चर जहाँ क्लाउड प्रदाता द्वारा कंप्यूटिंग इंफ्रास्ट्रक्चर का स्वचालित रूप से प्रबंधन किया जाता है, जिसमें उपयोग-आधारित बिलिंग और मांग के आधार पर स्वचालित स्केलेबिलिटी होती है।
Edge AI Deployment
एज डिवाइसेज पर ML मॉडल का तैनाती, जिससे अनुमान स्थानीय रूप से चलाया जा सके, जिससे लेटेंसी और नेटवर्क निर्भरता कम हो जाती है और साथ ही डेटा की गोपनीयता भी बनी रहती है।
Model Serving
इंफ्रास्ट्रक्चर और प्रक्रियाएँ जो उत्पादन में अनुमान के लिए API एंडपॉइंट के माध्यम से ML मॉडल को उजागर करने में सक्षम बनाती हैं, जिसमें लोडिंग, लाइफसाइकल प्रबंधन और अनुकूलन शामिल है।
Auto-scaling for ML
अनुमान लगाने के भार के आधार पर कंप्यूटिंग संसाधनों को गतिशील रूप से अनुकूलित करने की एक प्रक्रिया, जो अनुरोधों की संख्या या लेटेंसी जैसे विशिष्ट मेट्रिक्स का उपयोग करती है।
Model Observability
उत्पादन में मॉडल की आंतरिक स्थिति और व्यवहार को विस्तृत लॉग, मेट्रिक्स और ट्रेस के माध्यम से समझने की क्षमता, जो डिबगिंग और अनुकूलन के लिए उपयोगी होती है।
क्रमिक रोलआउट
नियंत्रित तैनाती रणनीति जहां नए मॉडल का एक्सपोजर धीरे-धीरे बढ़ता है (10%, 25%, 50%, 100%) प्रत्येक चरण पर सत्यापन के साथ।
मॉडल सीरियलाइज़ेशन
प्रशिक्षित मॉडल को संग्रहीत और परिवहन योग्य प्रारूप (Pickle, ONNX, SavedModel) में परिवर्तित करने की प्रक्रिया उत्पादन में तैनाती और अनुमान के लिए।
अनुमान पाइपलाइन
मॉडल के पूर्वानुमान से पहले और बाद में इनपुट डेटा पर लागू होने वाले प्रसंस्करण चरणों का अनुक्रम, जिसमें प्रीप्रोसेसिंग, अनुमान और पोस्टप्रोसेसिंग शामिल है।