تقييم المتانة - مسرد الذكاء الاصطناعي

📖

المصطلحات

دقة المتانة

مقياس يقيم أداء النموذج بناءً على الأمثلة العدائية المُنشأة ضمن نطاق معين من التشويش، مما يقيس بذلك مقاومته للهجمات. يجمع هذا المقياس الدقة التقليدية مع تقييم يخضع لقيود التشويش لكمية تدهور الأداء.

📖

المصطلحات

مسافة الهجوم

مقياس كمي للتشويش الأدنى اللازم لنجاح هجوم عدائي في خداع النموذج، ويُحسب عادةً وفقاً لمعايير مختلفة (L0, L1, L2, L∞). يتيح هذا المقياس مقارنة المتانة النسبية بين نماذج مختلفة أمام نفس أنواع الهجمات.

📖

المصطلحات

درجة المتانة

مؤشر مركب يقع بين 0 و 1 يقيم بشكل عام مقاومة النموذج أمام مجموعة متنوعة من الهجمات العدائية. يجمع هذا المؤشر عدة مقاييس للمتانة لتقديم تقييم شامل لأمان النموذج.

📖

المصطلحات

درجة لتقدير المتانة المحلية تعتمد على تدرجات ليبشيتز، مما يسمح بتقييم الحد الأدنى لمقاومة النموذج للهجمات دون الحاجة إلى هجمات محددة. يعتبر CLEVER (Cross Lipschitz Extreme Value for nEtwork Robustness) فعالاً بشكل خاص في تقييم متانة الشبكات العميقة القابلة للإثبات.

📖

المصطلحات

معيار AutoAttack

مجموعة تقييم معيارية آلية تجمع بين هجمات متعددة (APGD-CE, APGD-T, FAB, Square) لتوفير تقييم قوي وموثوق لمقاومة النماذج. يقوم AutoAttack بتعديل معلماته ديناميكياً لزيادة فعالية الهجمات وتقليل إخفاء التدرج.

📖

المصطلحات

تقييم المتانة المحلية

تحليل لمقاومة النموذج في جوار محدد حول عينة معينة، لتحديد ما إذا كانت التوقعات تظل ثابتة لجميع التشويشات في هذه المنطقة. يعد هذا التقييم حاسماً لفهم سلوك النموذج على المستوى الفردي بدلاً من المستوى المجمّع.

📖

المصطلحات

تقييم المتانة العالمية

قياس لمقاومة النموذج على كامل توزيع المدخلات الخاص به، من خلال تقييم متوسط أدائه أمام الهجمات على عينة كبيرة من البيانات. توفر هذه الطريقة رؤية شمولية لأمان النموذج في ظروف الاستخدام الحقيقية.

📖

المصطلحات

هامش المتانة

الحد الأدنى للمسافة بين حدود قرار النموذج وعينة إدخال، مما يحدد هامش الأمان قبل حدوث تغيير في التنبؤ. يعد هذا المقياس أساسياً لفهم الاستقرار الهندسي لقرارات النموذج.

📖

المصطلحات

درجة الأمان العدائي

مؤشر موحد يقيم مستوى حماية النموذج ضد عائلات مختلفة من الهجمات العدائية، حيث يوزن عادةً شدة الهجمات بناءً على احتمالية حدوثها. تساعد هذه الدرجة على مقارنة الأمان النسبي لهياكل النماذج المختلفة بشكل موضوعي.

📖

المصطلحات

مقياس المتانة

نظام تصنيف موحد يتيح تصنيف النماذج حسب مستوى مقاومتها للهجمات العدائية، ويقسم عادةً إلى عدة مستويات (منخفض، متوسط، مرتفع، معتمد). يسهل هذا المقياس التواصل بشأن متانة النماذج بين الباحثين والممارسين.

📖

المصطلحات

مؤشر الضعف

مقياس كمي يقيس حساسية النموذج للهجمات العدائية، ويُحسب كنسبة بين الأداء المتدهور تحت الهجوم والأداء الاسمي. يشير المؤشر المرتفع إلى ضعف كبير، بينما يشير المؤشر المنخفض إلى مقاومة أفضل.

📖

المصطلحات

معدل نجاح الهجوم

النسبة المئوية للعينات التي تنجح فيها هجمة عدائية في تغيير توقع النموذج، مما يقيس بشكل مباشر فعالية الهجمات ضد نموذج معين. هذا المقياس مكمل لدقة المتانة لتقييم أمان النموذج بشكل كامل.

📖

المصطلحات

الحد الأقصى للتشويش المسموح به

حد التشويش الأقصى الذي يمكن للنموذج تحمله دون تغيير في التنبؤ، ويخدم كمرجع لتقييم المتانة في ظل ظروف خاضعة للرقابة. هذه المقياس ضروري لتحديد قيود الأمان التشغيلية للنموذج.

📖

المصطلحات

تقييم المتانة التجريبي

منهجية تقييم تعتمد على توليد هجمات عدائية محددة لاختبار مقاومة النموذج، وتوفر تدابير عملية ولكن بدون ضمانات رسمية. تُستخدم هذه النهج على نطاق واسع لأنها تعكس سيناريوهات الهجوم الواقعية.

📖

المصطلحات

معيار RobustBench

منصة مرجعية موحدة لتقييم متانة نماذج تصنيف الصور، وتوفر بروتوكولات تقييم صارمة وتصنيفات مقارنة. يحتفظ RobustBench بقائمة بالنماذج القوية المعتمدة ومقاييس التقييم المعترف بها من قبل المجتمع.

📖

المصطلحات

مقياس المسافة Lp

معيار رياضي يستخدم لكمية سعة التشويشات العدائية، حيث يمكن أن تأخذ p قيمًا مختلفة (0، 1، 2، ∞) لقياس أنواع مختلفة من التعديلات. يؤثر اختيار معيار Lp بشكل كبير على تقييم المتانة بناءً على طبيعة التشويشات المعتبرة.

📖

المصطلحات

تقييم المتانة الرسمية

نهج رياضي صارم للتحقق من متانة نموذج من خلال إثبات الضمانات على جميع التشوهات الممكنة في مجال محدد. على عكس الأساليب التجريبية، يوفر التقييم الرسمي يقينًا مطلقًا ولكنه غالبًا ما يكون مكلفًا حسابيًا.

قاموس الذكاء الاصطناعي

دقة المتانة

مسافة الهجوم

درجة المتانة

مقياس CLEVER

معيار AutoAttack

تقييم المتانة المحلية

تقييم المتانة العالمية

هامش المتانة

درجة الأمان العدائي

مقياس المتانة

مؤشر الضعف

معدل نجاح الهجوم

الحد الأقصى للتشويش المسموح به

تقييم المتانة التجريبي

معيار RobustBench

مقياس المسافة Lp

تقييم المتانة الرسمية

لم يتم العثور على نتائج