एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
Calibration Dataset
स्थिर मात्रांकन के दौरान इष्टतम मान सीमाएं निर्धारित करने के लिए प्रशिक्षण डेटा का एक प्रतिनिधित्वकारी उपसमुच्चय, जो स्केल फैक्टर और जीरो पॉइंट की गणना के लिए आवश्यक है।
Dequantization
मात्रांकन की प्रक्रिया का विलोम, जो अनुमान (inference) के दौरान उच्च सटीकता वाली गणनाओं के लिए कम-सटीकता वाले पूर्णांक मानों को फ्लोटिंग-पॉइंट में वापस परिवर्तित करता है।
Mixed Precision Quantization
एक संकर रणनीति जो मॉडल की विभिन्न परतों (layers) पर उनकी मात्रांकन के प्रति संवेदनशीलता के आधार पर विभिन्न सटीकता स्तर (8-बिट, 4-बिट, 2-बिट) लागू करती है।
Per-channel Quantization
एक मात्रांकन तकनीक जो कनवल्शनल लेयर के प्रत्येक आउटपुट चैनल के लिए अलग-अलग स्केल फैक्टर लागू करती है, जिससे सीएनएन (CNN) की सटीकता में काफी सुधार होता है।
Per-tensor Quantization
एक सरल दृष्टिकोण जो पूरे टेंसर के लिए एक एकल स्केल फैक्टर और जीरो पॉइंट का उपयोग करता है, यह प्रति-चैनल मात्रांकन की तुलना में कम सटीक लेकिन गणना करने में तेज़ है।
Clipping Range
मात्रांकन से पहले चरम मानों को सीमित करने के लिए कैलिब्रेशन के दौरान परिभाषित मान सीमा, जो आउटलायर्स को बाहर करके मात्रांकन त्रुटि को कम करने के लिए आवश्यक है।
Layer-wise Quantization
एक विधि जो नेटवर्क की प्रत्येक परत (layer) के लिए मात्रांकन पैरामीटर को स्वतंत्र रूप से अनुकूलित करती है, जिसमें प्रत्येक परत के वितरण की विशिष्ट विशेषताओं को ध्यान में रखा जाता है।
Quantization Error
मूल फ्लोटिंग-पॉइंट मानों और उनके मात्रांकित प्रतिनिधित्व के बीच का अंतर, जिसे मात्रांकन की गुणवत्ता का मूल्यांकन करने के लिए MSE या KL डाइवर्जेंस जैसे मेट्रिक्स द्वारा मापा जाता है।
केवल-पूर्णांक अनुमान
वह निष्पादन प्रतिमान जिसमें मॉडल की सभी क्रियाएं पूर्णांक अंकगणित में की जाती हैं, जिससे अधिकतम प्रदर्शन के लिए फ्लोटिंग-पॉइंट रूपांतरणों को पूरी तरह से हटा दिया जाता है।