قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
هجوم نصي معاكس
تقنية تتضمن تعديل النص المدخل بشكل خفي لإضلال نموذج معالجة اللغات الطبيعية مع الحفاظ على الدلالة للقارئ البشري.
اضطراب على مستوى الأحرف
تعديل الأحرف الفردية في النص (إدراج، حذف، استبدال) لإنشاء أمثلة معاكسة يصعب اكتشافها.
هجوم بالاستبدال المعجمي
استبدال الكلمات بمرادفات دلالياً قريبة ولكنها تغير تنبؤ نموذج معالجة اللغات الطبيعية بطريقة مستهدفة.
محرضات معاكسة عالمية
تسلسلات محددة من الكلمات أو الأحرف التي، عند إدراجها في أي نص، تسبب بشكل منهجي خطأ في تصنيف النموذج.
هجوم الصندوق الأسود
هجوم يتم دون معرفة المعلمات الداخلية للنموذج، باستخدام تنبؤات النموذج فقط لبناء أمثلة معاكسة.
هجوم الصندوق الأبيض
هجوم يستغل المعرفة الكاملة بهيكل النموذج وتدرجاته لتوليد اضطرابات مثالية.
هجوم النقل
توليد أمثلة معاكسة على نموذج مصدر تحافظ على فعاليتها على نماذج مستهدفة غير معروفة.
الحفاظ الدلالي
قيد يضمن أن الاضطرابات النصية لا تعدل المعنى العام للنص بالنسبة للقارئ البشري.
هجوم تسميم البيانات
الإدراج الخبيث لأمثلة فاسدة في مجموعة التدريب لتدهور أداء النموذج أثناء مرحلة التعلم.
التشويش النحوي
تعديل البنية النحوية أو الصرفية لجملة مع الحفاظ على معناها الدلالي لخداع نماذج معالجة اللغات الطبيعية.
إخفاء التدرج
تقنية دفاع تعدل تدرج النموذج لمنع الهجمات القائمة على التحسين، دون تحسين المتانة الفعلية بالضرورة.
هجوم الاستعلام
هجوم الصندوق الأسود الذي يحسن التشويش من خلال الاستعلام عن النموذج بشكل متكرر وتحليل ردود أفعاله.
المتانة الدلالية
قدرة نموذج معالجة اللغات الطبيعية على الحفاظ على تنبؤات متسقة في مواجهة التباينات النصية التي تحافظ على المعنى ولكنها تغير الشكل.
مساحة البحث العدائية
مجموعة جميع التعديلات الممكنة للنص التي يمكن تطبيقها لتوليد أمثلة عدائية صالحة.
درجة التشويش
مقياس كمي يقيم حجم التعديل المطبق على النص الأصلي لإنشاء مثال عدائي.
هجوم متعدد الأهداف
هجوم عدائي يسعى في وقت واحد إلى خداع النموذج مع تحسين عدة قيود مثل القراءة أو الحفاظ على المعنى الدلالي.
كشف الهجمات المعادية
آلية دفاعية تحدد المدخلات المعادية المحتملة بناءً على الشذوذ الإحصائي أو السلوكي في التنبؤات.