एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
व्हाइट-बॉक्स हमले
वे हमले जिनमें विरोधी लक्ष्य मॉडल की वास्तुकला और मापदंडों को पूरी तरह से जानता है।
ब्लैक-बॉक्स हमले
मॉडल के आंतरिक ज्ञान के बिना, केवल इनपुट/आउटपुट के साथ अंतःक्रिया के माध्यम से किए गए हमले।
एवैज़न हमले
अनुमान के दौरान मॉडल को धोखा देने के लिए इनपुट डेटा में सूक्ष्म विक्षोभ।
विषाक्त हमले
मॉडल को समझौता करने के लिए प्रशिक्षण सेट में दुर्भावनापूर्ण डेटा का इंजेक्शन।
मॉडल एक्सट्रैक्शन हमले
बार-बार अनुरोधों द्वारा किसी प्रोपराइटरी मॉडल के पैरामीटर या कार्यक्षमता की चोरी।
सदस्यता अनुमान हमले
यह निर्धारित करना कि क्या कोई विशिष्ट डेटा पॉइंट प्रशिक्षण सेट का हिस्सा था।
प्रतिकूल प्रशिक्षण द्वारा रक्षा
मॉडल की सुस्थिरता में सुधार करने के लिए उत्पन्न प्रतिकूल उदाहरणों पर उसका प्रशिक्षण।
हमलों की पहचान द्वारा रक्षा
संभावित रूप से प्रतिकूल इनपुट की पहचान करने और अस्वीकार करने के लिए तंत्र
ग्रेडिएंट मास्किंग द्वारा रक्षा
ऑप्टिमाइज़ेशन आधारित हमलों को रोकने के लिए ग्रेडिएंट्स को छिपाने की तकनीकें
कंप्यूटर विज़न पर हमले
छवि वर्गीकरण और वस्तु पहचान मॉडलों को धोखा देने के लिए विशेष रूप से डिज़ाइन किए गए हमले।
NLP पर हमले
प्राकृतिक भाषा प्रसंस्करण मॉडलों को बहकाने के लिए सूक्ष्म पाठ व्यवधान।
ट्रांसफर हमले
एक स्रोत मॉडल पर उत्पन्न हमले लेकिन विभिन्न लक्ष्य मॉडलों के खिलाफ प्रभावी।
यादृच्छिकीकरण द्वारा रक्षा
हमलों को बाधित करने के लिए अनुमान प्रक्रिया में यादृच्छिकता का परिचय।
ऑडियो मॉडल पर हमले
आवाज़ पहचान प्रणालियों को बहकाने के लिए डिज़ाइन किए गए अधिसूचनीय ध्वनि विक्षेपण।
मजबूती का मूल्यांकन
विरोधाभासी हमलों के खिलाफ मॉडल की प्रतिरोधक क्षमता को मापने के लिए मेट्रिक्स और बेंचमार्क।