एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
क्वांटिफिकेशन
एआई मॉडल के वज़न और एक्टिवेशन की संख्यात्मक सटीकता को कम करने की प्रक्रिया, जो इनफेरेंस को अनुकूलित करती है और मेमोरी फुटप्रिंट को कम करती है।
8-बिट क्वांटिफिकेशन
एक संपीड़न तकनीक जो मॉडल के वज़न को 32 बिट से 8 बिट तक कम करती है, एलएलएम के लिए प्रदर्शन और सटीकता के बीच इष्टतम समझौता प्रदान करती है।
4-बिट क्वांटिफिकेशन
एक चरम संपीड़न विधि जो वज़न को 4 बिट तक कम करती है, जिससे मेमोरी में महत्वपूर्ण लाभ मिलते हैं लेकिन गुणवत्ता में संभावित हानि होती है।
पोस्ट-ट्रेनिंग क्वांटिफिकेशन (PTQ)
मॉडल के प्रशिक्षण के बाद लागू की जाने वाली तकनीक, जो पूर्ण पुनः प्रशिक्षण की आवश्यकता के बिना वज़न को कम सटीकता में परिवर्तित करती है।
क्वांटिफिकेशन अवेयर ट्रेनिंग (QAT)
प्रशिक्षण की एक दृष्टिकोण जो सीखने की प्रक्रिया के दौरान क्वांटिफिकेशन के प्रभावों का अनुकरण करता है ताकि सटीकता की हानि को कम किया जा सके।
डायनामिक क्वांटिफिकेशन
इनफेरेंस पर लागू की जाने वाली विधि जहां एक्टिवेशन को रीयल-टाइम में क्वांटिफाई किया जाता है, जो लचीलापन प्रदान करती है लेकिन कम्प्यूटेशनल ओवरहेड के साथ आती है।
स्टैटिक क्वांटिफिकेशन
एक दृष्टिकोण जो इनफेरेंस से पहले क्वांटिफिकेशन पैरामीटर्स को प्रीकैलकुलेट करता है, जो लचीलेपन की कीमत पर गति को अनुकूलित करता है।
क्वांटिफिकेशन कैलिब्रेशन
प्रतिनिधि डेटा के नमूने से इष्टतम क्वांटिफिकेशन पैरामीटर्स (स्केल, जीरो-पॉइंट) निर्धारित करने की प्रक्रिया।
GPTQ
ग्रेडिएंट-आधारित पोस्ट ट्रेनिंग क्वांटिजेशन, एक उन्नत तकनीक जो पुनर्निर्माण त्रुटि को कम करने के लिए क्वांटाइज्ड वजनों को पुनरावृत्त रूप से अनुकूलित करती है।
AWQ
एक्टिवेशन-अवेयर वेट क्वांटिजेशन, एक विधि जो संबंधित एक्टिवेशन के आयाम के अनुसार वजनों के महत्व को वेट करती है।
जीरो-शॉट क्वांटिफिकेशन
एक तकनीक जिसमें किसी कैलिब्रेशन डेटा की आवश्यकता नहीं होती, यह मॉडल को क्वांटाइज करने के लिए वजनों के वितरण पर आधारित ह्यूरिस्टिक्स का उपयोग करती है।
मिक्स्ड प्रिसिजन क्वांटिफिकेशन
एक रणनीति जो प्रदर्शन/सटीकता समझौता को अनुकूलित करने के लिए मॉडल की विभिन्न परतों के अनुसार अलग-अलग क्वांटिजेशन परिशुद्धता लागू करती है।
सिमेट्रिक क्वांटिजेशन
क्वांटिजेशन स्कीम जहां मानों की रेंज शून्य के आसपास केंद्रित होती है, जो गणनाओं को सरल बनाती है लेकिन डायनामिक रेंज का पूरा उपयोग नहीं कर सकती।
एसिमेट्रिक क्वांटिजेशन
एक दृष्टिकोण जो शून्य पर केंद्रित नहीं होने वाले मानों की रेंज की अनुमति देता है, जो एसिमेट्रिक वितरण के लिए क्वांटाइज्ड रेंज के उपयोग को अनुकूलित करता है।
स्केल फैक्टर
एक गुणक पैरामीटर जिसका उपयोग निरंतर मानों को क्वांटाइज्ड रेंज में मैप करने के लिए किया जाता है, जो क्वांटिजेशन की सटीकता के लिए महत्वपूर्ण है।
जीरो पॉइंट
एसिमेट्रिक क्वांटिजेशन के दौरान जोड़ा गया ऑफसेट जो फ्लोटिंग पॉइंट शून्य मान को क्वांटाइज्ड प्रतिनिधित्व के साथ संरेखित करने के लिए होता है।
क्वांटिजेशन शोर
सटीकता में कमी से उत्पन्न त्रुटि, जो वज़न के अनुमान के कारण मॉडल प्रदर्शन में गिरावट के रूप में प्रकट होती है।
क्वांटिजेशन-अवेयर फाइन-ट्यूनिंग
मॉडल संपीड़न के दौरान खोई गई सटीकता को पुनः प्राप्त करने के लिए क्वांटिजेशन के बाद हल्के समायोजन की प्रक्रिया।
स्मूदक्वांट
पूर्व गणितीय परिवर्तन द्वारा वज़न और सक्रियताओं के बीच क्वांटिजेशन की कठिनाई को समान करने वाली क्वांटिजेशन तकनीक।
एलएलएम.इंट8()
बड़े भाषा मॉडलों के लिए विशिष्ट 8-बिट क्वांटिजेशन विधि, जो मैट्रिक्स अपघटन और संकर क्वांटिजेशन को जोड़ती है।