एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
एम्बेडेड AutoML
AutoML का एक उप-क्षेत्र जो एम्बेडेड उपकरणों की विशिष्ट बाधाओं, जैसे कि सीमित मेमोरी, कम कंप्यूटिंग शक्ति और ऊर्जा बाधाओं के लिए अनुकूलित मॉडल उत्पन्न करने में विशेषज्ञता रखता है।
मॉडल क्वांटाइज़ेशन
एक अनुकूलन तकनीक जो एक न्यूरल नेटवर्क के वज़न और एक्टिवेशन की संख्यात्मक सटीकता को कम करती है (आमतौर पर 32-बिट से 8-बिट या उससे कम), ताकि मॉडल का आकार कम किया जा सके और बाधित हार्डवेयर पर अनुमान लगाने को तेज़ किया जा सके।
न्यूरल प्रूनिंग
एक न्यूरल नेटवर्क में अतिरिक्त वज़न या न्यूरॉन्स को चुनिंदा रूप से हटाने की प्रक्रिया, जिससे इसकी कम्प्यूटेशनल जटिलता और मेमोरी आकार को कम किया जाता है, जबकि इसकी सटीकता बनी रहती है।
नॉलेज डिस्टिलेशन
एक ट्रांसफर लर्निंग विधि जहाँ एक बड़ा टीचर मॉडल एक अधिक कॉम्पैक्ट स्टूडेंट मॉडल को प्रशिक्षित करता है, जिससे बड़े मॉडल के प्रदर्शन को एज डिवाइसेस के लिए उपयुक्त आर्किटेक्चर में संरक्षित किया जा सके।
इन्फेरेंस अनुकूलन
एक प्रशिक्षित मॉडल को निष्पादित करने के लिए आवश्यक समय और संसाधनों को कम करने के लिए तकनीकों का एक समूह, जिसमें ऑपरेशन फ्यूजन, कुशल मेमोरी आवंटन और हार्डवेयर समानता का लाभ उठाना शामिल है।
एज के लिए NAS
एक बाधित न्यूरल आर्किटेक्चर खोज जो स्वचालित रूप से नेटवर्क संरचनाओं को अनुकूलित करती है, जिसमें एज डिवाइसेस की हार्डवेयर सीमाओं, जैसे लक्ष्य विलंबता और ऊर्जा खपत, को विशेष रूप से ध्यान में रखा जाता है।
मॉडल कंपाइलर
एक उपकरण जो AI कंप्यूटेशन ग्राफ को विशिष्ट लक्ष्य आर्किटेक्चर के लिए अनुकूलित मशीन कोड में परिवर्तित करता है, जिसमें क्वांटाइज़ेशन और ऑपरेशन फ्यूजन जैसे अनुकूलन शामिल हैं।
TensorRT
उत्पादन में AI मॉडल तैनात करने के लिए NVIDIA का एक अनुकूलन और रनटाइम SDK, जो NVIDIA GPU पर अधिकतम प्रदर्शन के लिए क्वांटाइज़ेशन, लेयर फ्यूजन और कर्नेल अनुकूलन का उपयोग करता है।
TinyML
मशीन लर्निंग का वह डोमेन जो माइक्रोकंट्रोलर्स और अल्ट्रा-लो पावर डिवाइसेस पर एआई मॉडल चलाने पर केंद्रित है, जिसमें आमतौर पर 1MB से कम मेमोरी और 1mW से कम पर चलने वाले होते हैं।
Edge TPU
गूगल द्वारा विकसित एक ASIC हार्डवेयर एक्सेलेरेटर जो विशेष रूप से एज पर एआई इन्फेरेंस के लिए बनाया गया है, और क्वांटाइज़्ड TensorFlow लाइट मॉडल्स को उच्च ऊर्जा दक्षता के साथ चलाने के लिए अनुकूलित है।
Optimisation de la mémoire
मॉडल्स की मेमोरी फुटप्रिंट को कम करने की तकनीकें, जिसमें वेट शेयरिंग, कंप्रेशन और एम्बेडेड डिवाइसेस की बाधाओं के अनुसार अनुकूलन के लिए डायनामिक आवंटन शामिल है।
Latence d'inférence
किसी मॉडल में डेटा इनपुट करने और उसकी पूर्वानुमान प्राप्त करने के बीच का समय, जो रियल-टाइम एज एप्लिकेशन्स में एक महत्वपूर्ण पैरामीटर है जहाँ लक्ष्य मान आमतौर पर 10ms से कम होता है।
Modèle allégé
एक न्यूरल नेटवर्क आर्किटेक्चर जो विशेष रूप से पैरामीटर्स और कम्प्यूटेशनल ऑपरेशन्स को कम करने के लिए डिज़ाइन की गई है, जैसे MobileNet या EfficientNet, जो मोबाइल और एज पर डिप्लॉयमेंट के लिए अनुकूलित है।
Déploiement distribué
एआई वर्कलोड को कई एज डिवाइसेस के बीच वितरित करने की रणनीति, ताकि समग्र संसाधनों का अनुकूलन किया जा सके और वितरित एआई एप्लिकेशन्स की स्केलेबिलिटी में सुधार हो सके।
Optimisation énergétique
एज डिवाइसेस पर एआई मॉडल्स की बिजली खपत को कम करने की प्रक्रिया, जो बैटरी से चलने वाले एप्लिकेशन्स और बड़े पैमाने पर डिप्लॉयमेंट के लिए महत्वपूर्ण है।
Edge AI
आर्टिफिशियल इंटेलिजेंस को सीधे एज डिवाइसेस पर प्रोसेस करने का एक पैराडाइम, जो महत्वपूर्ण इन्फेरेंस कार्यों के लिए क्लाउड के साथ संचार की आवश्यकता को समाप्त करता है।
एआई माइक्रोकंट्रोलर
एक अल्ट्रा-लो पावर सिस्टम-ऑन-चिप जिसमें एआई इन्फेरेंस के लिए समर्पित हार्डवेयर एक्सेलेरेटर एकीकृत होते हैं, जो कुछ माइक्रोवाट की खपत पर टाइनीएमएल मॉडल को चलाने की अनुमति देता है।
हार्डवेयर-अवेयर ऑप्टिमाइज़ेशन
ऑटोएमएल का एक दृष्टिकोण जो मॉडलों के स्वचालित डिज़ाइन प्रक्रिया में लक्ष्य हार्डवेयर की विशिष्ट विशेषताओं को एकीकृत करता है, जिससे इष्टतम संगतता और प्रदर्शन सुनिश्चित होता है।
ऑपरेशन फ़्यूज़न
एक कंपाइलेशन तकनीक जो कई आसन्न परतों या ऑपरेशनों को एक कर्नेल ऑपरेशन में जोड़ती है, जिससे मेमोरी ओवरहेड कम होता है और एज पर कम्प्यूटेशनल दक्षता में सुधार होता है।