قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
دقة المتانة
مقياس يقيم أداء النموذج بناءً على الأمثلة العدائية المُنشأة ضمن نطاق معين من التشويش، مما يقيس بذلك مقاومته للهجمات. يجمع هذا المقياس الدقة التقليدية مع تقييم يخضع لقيود التشويش لكمية تدهور الأداء.
مسافة الهجوم
مقياس كمي للتشويش الأدنى اللازم لنجاح هجوم عدائي في خداع النموذج، ويُحسب عادةً وفقاً لمعايير مختلفة (L0, L1, L2, L∞). يتيح هذا المقياس مقارنة المتانة النسبية بين نماذج مختلفة أمام نفس أنواع الهجمات.
درجة المتانة
مؤشر مركب يقع بين 0 و 1 يقيم بشكل عام مقاومة النموذج أمام مجموعة متنوعة من الهجمات العدائية. يجمع هذا المؤشر عدة مقاييس للمتانة لتقديم تقييم شامل لأمان النموذج.
مقياس CLEVER
درجة لتقدير المتانة المحلية تعتمد على تدرجات ليبشيتز، مما يسمح بتقييم الحد الأدنى لمقاومة النموذج للهجمات دون الحاجة إلى هجمات محددة. يعتبر CLEVER (Cross Lipschitz Extreme Value for nEtwork Robustness) فعالاً بشكل خاص في تقييم متانة الشبكات العميقة القابلة للإثبات.
معيار AutoAttack
مجموعة تقييم معيارية آلية تجمع بين هجمات متعددة (APGD-CE, APGD-T, FAB, Square) لتوفير تقييم قوي وموثوق لمقاومة النماذج. يقوم AutoAttack بتعديل معلماته ديناميكياً لزيادة فعالية الهجمات وتقليل إخفاء التدرج.
تقييم المتانة المحلية
تحليل لمقاومة النموذج في جوار محدد حول عينة معينة، لتحديد ما إذا كانت التوقعات تظل ثابتة لجميع التشويشات في هذه المنطقة. يعد هذا التقييم حاسماً لفهم سلوك النموذج على المستوى الفردي بدلاً من المستوى المجمّع.
تقييم المتانة العالمية
قياس لمقاومة النموذج على كامل توزيع المدخلات الخاص به، من خلال تقييم متوسط أدائه أمام الهجمات على عينة كبيرة من البيانات. توفر هذه الطريقة رؤية شمولية لأمان النموذج في ظروف الاستخدام الحقيقية.
هامش المتانة
الحد الأدنى للمسافة بين حدود قرار النموذج وعينة إدخال، مما يحدد هامش الأمان قبل حدوث تغيير في التنبؤ. يعد هذا المقياس أساسياً لفهم الاستقرار الهندسي لقرارات النموذج.
درجة الأمان العدائي
مؤشر موحد يقيم مستوى حماية النموذج ضد عائلات مختلفة من الهجمات العدائية، حيث يوزن عادةً شدة الهجمات بناءً على احتمالية حدوثها. تساعد هذه الدرجة على مقارنة الأمان النسبي لهياكل النماذج المختلفة بشكل موضوعي.
مقياس المتانة
نظام تصنيف موحد يتيح تصنيف النماذج حسب مستوى مقاومتها للهجمات العدائية، ويقسم عادةً إلى عدة مستويات (منخفض، متوسط، مرتفع، معتمد). يسهل هذا المقياس التواصل بشأن متانة النماذج بين الباحثين والممارسين.
مؤشر الضعف
مقياس كمي يقيس حساسية النموذج للهجمات العدائية، ويُحسب كنسبة بين الأداء المتدهور تحت الهجوم والأداء الاسمي. يشير المؤشر المرتفع إلى ضعف كبير، بينما يشير المؤشر المنخفض إلى مقاومة أفضل.
معدل نجاح الهجوم
النسبة المئوية للعينات التي تنجح فيها هجمة عدائية في تغيير توقع النموذج، مما يقيس بشكل مباشر فعالية الهجمات ضد نموذج معين. هذا المقياس مكمل لدقة المتانة لتقييم أمان النموذج بشكل كامل.
الحد الأقصى للتشويش المسموح به
حد التشويش الأقصى الذي يمكن للنموذج تحمله دون تغيير في التنبؤ، ويخدم كمرجع لتقييم المتانة في ظل ظروف خاضعة للرقابة. هذه المقياس ضروري لتحديد قيود الأمان التشغيلية للنموذج.
تقييم المتانة التجريبي
منهجية تقييم تعتمد على توليد هجمات عدائية محددة لاختبار مقاومة النموذج، وتوفر تدابير عملية ولكن بدون ضمانات رسمية. تُستخدم هذه النهج على نطاق واسع لأنها تعكس سيناريوهات الهجوم الواقعية.
معيار RobustBench
منصة مرجعية موحدة لتقييم متانة نماذج تصنيف الصور، وتوفر بروتوكولات تقييم صارمة وتصنيفات مقارنة. يحتفظ RobustBench بقائمة بالنماذج القوية المعتمدة ومقاييس التقييم المعترف بها من قبل المجتمع.
مقياس المسافة Lp
معيار رياضي يستخدم لكمية سعة التشويشات العدائية، حيث يمكن أن تأخذ p قيمًا مختلفة (0، 1، 2، ∞) لقياس أنواع مختلفة من التعديلات. يؤثر اختيار معيار Lp بشكل كبير على تقييم المتانة بناءً على طبيعة التشويشات المعتبرة.
تقييم المتانة الرسمية
نهج رياضي صارم للتحقق من متانة نموذج من خلال إثبات الضمانات على جميع التشوهات الممكنة في مجال محدد. على عكس الأساليب التجريبية، يوفر التقييم الرسمي يقينًا مطلقًا ولكنه غالبًا ما يكون مكلفًا حسابيًا.