هجمات على معالجة اللغة الطبيعية - مسرد الذكاء الاصطناعي

📖

المصطلحات

هجوم نصي معاكس

تقنية تتضمن تعديل النص المدخل بشكل خفي لإضلال نموذج معالجة اللغات الطبيعية مع الحفاظ على الدلالة للقارئ البشري.

📖

المصطلحات

اضطراب على مستوى الأحرف

تعديل الأحرف الفردية في النص (إدراج، حذف، استبدال) لإنشاء أمثلة معاكسة يصعب اكتشافها.

📖

المصطلحات

هجوم بالاستبدال المعجمي

استبدال الكلمات بمرادفات دلالياً قريبة ولكنها تغير تنبؤ نموذج معالجة اللغات الطبيعية بطريقة مستهدفة.

📖

المصطلحات

محرضات معاكسة عالمية

تسلسلات محددة من الكلمات أو الأحرف التي، عند إدراجها في أي نص، تسبب بشكل منهجي خطأ في تصنيف النموذج.

📖

المصطلحات

هجوم الصندوق الأسود

هجوم يتم دون معرفة المعلمات الداخلية للنموذج، باستخدام تنبؤات النموذج فقط لبناء أمثلة معاكسة.

📖

المصطلحات

هجوم الصندوق الأبيض

هجوم يستغل المعرفة الكاملة بهيكل النموذج وتدرجاته لتوليد اضطرابات مثالية.

📖

المصطلحات

هجوم النقل

توليد أمثلة معاكسة على نموذج مصدر تحافظ على فعاليتها على نماذج مستهدفة غير معروفة.

📖

المصطلحات

الحفاظ الدلالي

قيد يضمن أن الاضطرابات النصية لا تعدل المعنى العام للنص بالنسبة للقارئ البشري.

📖

المصطلحات

هجوم تسميم البيانات

الإدراج الخبيث لأمثلة فاسدة في مجموعة التدريب لتدهور أداء النموذج أثناء مرحلة التعلم.

📖

المصطلحات

التشويش النحوي

تعديل البنية النحوية أو الصرفية لجملة مع الحفاظ على معناها الدلالي لخداع نماذج معالجة اللغات الطبيعية.

📖

المصطلحات

إخفاء التدرج

تقنية دفاع تعدل تدرج النموذج لمنع الهجمات القائمة على التحسين، دون تحسين المتانة الفعلية بالضرورة.

📖

المصطلحات

هجوم الاستعلام

هجوم الصندوق الأسود الذي يحسن التشويش من خلال الاستعلام عن النموذج بشكل متكرر وتحليل ردود أفعاله.

📖

المصطلحات

المتانة الدلالية

قدرة نموذج معالجة اللغات الطبيعية على الحفاظ على تنبؤات متسقة في مواجهة التباينات النصية التي تحافظ على المعنى ولكنها تغير الشكل.

📖

المصطلحات

مساحة البحث العدائية

مجموعة جميع التعديلات الممكنة للنص التي يمكن تطبيقها لتوليد أمثلة عدائية صالحة.

📖

المصطلحات

درجة التشويش

مقياس كمي يقيم حجم التعديل المطبق على النص الأصلي لإنشاء مثال عدائي.

📖

المصطلحات

هجوم متعدد الأهداف

هجوم عدائي يسعى في وقت واحد إلى خداع النموذج مع تحسين عدة قيود مثل القراءة أو الحفاظ على المعنى الدلالي.

📖

المصطلحات

كشف الهجمات المعادية

آلية دفاعية تحدد المدخلات المعادية المحتملة بناءً على الشذوذ الإحصائي أو السلوكي في التنبؤات.

قاموس الذكاء الاصطناعي

هجوم نصي معاكس

اضطراب على مستوى الأحرف

هجوم بالاستبدال المعجمي

محرضات معاكسة عالمية

هجوم الصندوق الأسود

هجوم الصندوق الأبيض

هجوم النقل

الحفاظ الدلالي

هجوم تسميم البيانات

التشويش النحوي

إخفاء التدرج

هجوم الاستعلام

المتانة الدلالية

مساحة البحث العدائية

درجة التشويش

هجوم متعدد الأهداف

كشف الهجمات المعادية

لم يتم العثور على نتائج