एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
सटीकता मजबूती
एक मेट्रिक जो किसी मॉडल के प्रदर्शन का मूल्यांकन विरोधी उदाहरणों पर करती है जो एक निश्चित व्यवधान सीमा के भीतर उत्पन्न होते हैं, और इस प्रकार आक्रमणों के प्रति इसके प्रतिरोध को मापती है। यह मेट्रिक प्रदर्शन की हानि को मात्रांकित करने के लिए शास्त्रीय सटीकता को व्यवधान बाधाओं के तहत मूल्यांकन के साथ जोड़ती है।
आक्रमण दूरी
न्यूनतम व्यवधान का मात्रात्मक माप जो किसी मॉडल को धोखा देने के लिए एक विरोधी आक्रमण को सफल बनाने के लिए आवश्यक है, आमतौर पर विभिन्न मानदंडों (L0, L1, L2, L∞) के अनुसार गणना की जाती है। यह मेट्रिक समान प्रकार के आक्रमणों के सामने विभिन्न मॉडलों के बीच सापेक्ष मजबूती की तुलना करने की अनुमति देती है।
मजबूती स्कोर
0 और 1 के बीच सामान्यीकृत समग्र सूचकांक जो विरोधी आक्रमणों के एक विविध सेट के सामने किसी मॉडल के प्रतिरोध का समग्र रूप से मूल्यांकन करता है। यह स्कोर मॉडल की सुरक्षा का एक संश्लेषित मूल्यांकन प्रदान करने के लिए कई मजबूती मेट्रिक्स को एकत्रित करता है।
CLEVER मेट्रिक
लिप्सचिट्ज़ ग्रेडिएंट पर आधारित स्थानीय मजबूती का अनुमान स्कोर, जो बिना किसी विशिष्ट आक्रमण की आवश्यकता के आक्रमणों के प्रति मॉडल के प्रतिरोध पर एक निचली सीमा का मूल्यांकन करने की अनुमति देता है। CLEVER (Cross Lipschitz Extreme Value for nEtwork Robustness) गहरे नेटवर्कों की प्रमाणित मजबूती का मूल्यांकन करने के लिए विशेष रूप से प्रभावी है।
AutoAttack बेंचमार्क
मॉडलों की प्रतिरोध का एक मजबूत और विश्वसनीय मूल्यांकन प्रदान करने के लिए कई आक्रमणों (APGD-CE, APGD-T, FAB, Square) को जोड़ने वाला एक स्वचालित मानकीकृत मूल्यांकन सूट। AutoAttack आक्रमणों की दक्षता को अधिकतम करने और ग्रेडिएंट मास्किंग को कम करने के लिए गतिशील रूप से अपने मापदंडों को अनुकूलित करता है।
स्थानीय मजबूती मूल्यांकन
किसी दिए गए नमूने के चारों ओर एक विशिष्ट पड़ोस में किसी मॉडल के प्रतिरोध का विश्लेषण, यह निर्धारित करना कि क्या उस क्षेत्र में सभी व्यवधानों के लिए भविष्यवाणी स्थिर रहती है। यह मूल्यांकन समग्र स्तर के बजाय व्यक्तिगत स्तर पर मॉडल के व्यवहार को समझने के लिए महत्वपूर्ण है।
वैश्विक मजबूती मूल्यांकन
अपनी पूरी इनपुट वितरण पर किसी मॉडल के प्रतिरोध का माप, डेटा के एक बड़े नमूने पर आक्रमणों के सामने इसके औसत प्रदर्शन का मूल्यांकन करना। यह दृष्टिकोण वास्तविक उपयोग की स्थितियों में मॉडल की सुरक्षा का एक स्थूल दृश्य प्रदान करता है।
मजबूती का मार्जिन
किसी मॉडल की निर्णय सीमा और एक इनपुट नमूने के बीच न्यूनतम दूरी, जो भविष्यवाणी में बदलाव होने से पहले सुरक्षा का मार्जिन मात्रांकित करती है। यह मेट्रिक मॉडल के निर्णयों की ज्यामितीय स्थिरता को समझने के लिए मौलिक है।
विरोधी सुरक्षा स्कोर
एक मानकीकृत सूचक जो विभिन्न प्रकार के विरोधी हमलों के खिलाफ एक मॉडल के सुरक्षा स्तर का मूल्यांकन करता है, जो आमतौर पर हमलों की गंभीरता को उनके होने की संभावना से भारित करता है। यह स्कोर विभिन्न मॉडल आर्किटेक्चर की सापेक्ष सुरक्षा की तुलना वस्तुनिष्ठ रूप से करने में मदद करता है।
सुदृढ़ता पैमाना
एक मानकीकृत वर्गीकरण प्रणाली जो मॉडल को विरोधी हमलों के प्रति उनके प्रतिरोध के स्तर के अनुसार वर्गीकृत करने की अनुमति देती है, जो आमतौर पर कई स्तरों (निम्न, मध्यम, उच्च, प्रमाणित) में विभाजित होती है। यह पैमाना शोधकर्ताओं और प्रैक्टिशनर्स के बीच मॉडल की सुदृढ़ता के बारे में संचार को सुविधाजनक बनाता है।
भेद्यता सूचकांक
एक मात्रात्मक मेट्रिक जो विरोधी हमलों के प्रति एक मॉडल की संवेदनशीलता को मापती है, जिसकी गणना हमले के तहत गिरी हुई प्रदर्शन और सामान्य प्रदर्शन के बीच के अनुपात के रूप में की जाती है। एक उच्च सूचकांक उच्च भेद्यता का संकेत देता है, जबकि एक निम्न सूचकांक बेहतर प्रतिरोध का सुझाव देता है।
हमले की सफलता दर
उन नमूनों का प्रतिशत जिनके लिए एक विरोधी हमला मॉडल की भविष्यवाणी को बदलने में सफल होता है, जो किसी दिए गए मॉडल के खिलाफ हमलों की प्रभावशीलता को सीधे मापता है। मॉडल की सुरक्षा का पूर्ण मूल्यांकन करने के लिए यह मेट्रिक रोबस्टनेस सटीकता के पूरक है।
अधिकतम अनुमेय विक्षोभ
अधिकतम विक्षोभ सीमा जिसे एक मॉडल बिना भविष्यवाणी बदले सहन कर सकता है, जो नियंत्रित स्थितियों में सुदृढ़ता का मूल्यांकन करने के लिए एक संदर्भ के रूप में कार्य करता है। मॉडल की परिचालन सुरक्षा बाधाओं को परिभाषित करने के लिए यह माप आवश्यक है।
प्रायोगिक सुदृढ़ता मूल्यांकन
एक मॉडल के प्रतिरोध का परीक्षण करने के लिए विशिष्ट विरोधी हमलों की पीढ़ी पर आधारित मूल्यांकन कार्यप्रणाली, जो व्यावहारिक उपाय प्रदान करती है लेकिन कोई औपचारिक गारंटी नहीं देती है। यह दृष्टिकोण व्यापक रूप से उपयोग किया जाता है क्योंकि यह वास्तविक हमले के परिदृश्यों को दर्शाता है।
रोबस्टबेंच बेंचमार्क
छवि वर्गीकरण मॉडल की सुदृढ़ता के मूल्यांकन के लिए एक मानकीकृत संदर्भ प्लेटफ़ॉर्म, जो कड़े मूल्यांकन प्रोटोकॉल और तुलनात्मक रैंकिंग प्रदान करता है। रोबस्टबेंच प्रमाणित सुदृढ़ मॉडल और समुदाय द्वारा मान्यता प्राप्त मूल्यांकन मेट्रिक्स की एक सूची बनाए रखता है।
Lp दूरी मेट्रिक
विरोधी विक्षोभ के परिमाण को मात्रात्मक रूप देने के लिए उपयोग की जाने वाली गणितीय मानक, जहां p विभिन्न प्रकार के संशोधनों को मापने के लिए विभिन्न मान (0, 1, 2, ∞) ले सकता है। विचार किए गए विक्षोभ की प्रकृति के आधार पर Lp मानक का चयन सुदृढ़ता के मूल्यांकन को महत्वपूर्ण रूप से प्रभावित करता है।
औपचारिक मजबूती मूल्यांकन
एक निर्दिष्ट डोमेन में सभी संभावित विक्षेपणों पर गारंटी साबित करके किसी मॉडल की मजबूती की जांच के लिए गणितीय रूप से कठोर दृष्टिकोण। अनुभवजन्य विधियों के विपरीत, औपचारिक मूल्यांकन पूर्ण निश्चितता प्रदान करता है, लेकिन यह अक्सर गणनात्मक रूप से महंगा होता है।