এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
Accuracy Robustesse
Métrique évaluant la performance d'un modèle sur des exemples adversariaux générés dans une certaine borne de perturbation, mesurant ainsi sa résistance aux attaques. Cette métrique combine la précision classique avec une évaluation sous contraintes de perturbation pour quantifier la dégradation des performances.
Distance d'Attaque
Mesure quantitative de la perturbation minimale nécessaire pour qu'une attaque adversariale réussisse à tromper un modèle, généralement calculée selon différentes normes (L0, L1, L2, L∞). Cette métrique permet de comparer la robustesse relative entre différents modèles face aux mêmes types d'attaques.
Score de Robustesse
Indice composite normalisé entre 0 et 1 évaluant globalement la résistance d'un modèle face à un ensemble varié d'attaques adversariales. Ce score agrège plusieurs métriques de robustesse pour fournir une évaluation synthétique de la sécurité du modèle.
Métrique CLEVER
Score d'estimation de la robustesse locale basé sur les gradients Lipschitz, permettant d'évaluer une borne inférieure sur la résistance d'un modèle aux attaques sans nécessiter d'attaques spécifiques. CLEVER (Cross Lipschitz Extreme Value for nEtwork Robustness) est particulièrement efficace pour évaluer la robustesse certificative des réseaux profonds.
Benchmark AutoAttack
Suite d'évaluation standardisée automatisée combinant multiple attaques (APGD-CE, APGD-T, FAB, Square) pour fournir une évaluation robuste et fiable de la résistance des modèles. AutoAttack adapte dynamiquement ses paramètres pour maximiser l'efficacité des attaques et minimiser le gradient masking.
Évaluation de Robustesse Locale
Analyse de la résistance d'un modèle dans un voisinage spécifique autour d'un échantillon donné, déterminant si la prédiction reste constante pour toutes les perturbations dans cette région. Cette évaluation est cruciale pour comprendre le comportement du modèle au niveau individuel plutôt qu'agrégré.
Évaluation de Robustesse Globale
Mesure de la résistance d'un modèle sur l'ensemble de sa distribution d'entrée, évaluant sa performance moyenne face aux attaques sur un large échantillon de données. Cette approche fournit une vision macroscopique de la sécurité du modèle dans des conditions réelles d'utilisation.
Marge de Robustesse
Distance minimale entre la frontière de décision d'un modèle et un échantillon d'entrée, quantifiant la marge de sécurité avant qu'un changement de prédiction ne se produise. Cette métrique est fondamentale pour comprendre la stabilité géométrique des décisions du modèle.
বিপক্ষীয় নিরাপত্তা স্কোর
বিভিন্ন ধরনের বিপক্ষীয় আক্রমণের বিরুদ্ধে একটি মডেলের সুরক্ষা স্তর মূল্যায়নকারী প্রমিত সূচক, যা সাধারণত আক্রমণের তীব্রতাকে তাদের সংঘটনের সম্ভাবনা দ্বারা ওজন করে। এই স্কোর বিভিন্ন মডেল আর্কিটেকচারের আপেক্ষিক নিরাপত্তা বস্তুনিষ্ঠভাবে তুলনা করতে সহায়তা করে।
সহনশীলতা স্কেল
বিপক্ষীয় আক্রমণের বিরুদ্ধে মডেলগুলোর প্রতিরোধ ক্ষমতার স্তর অনুযায়ী শ্রেণীবিভাগ করার জন্য প্রমিত শ্রেণীবিভাগ পদ্ধতি, যা সাধারণত কয়েকটি স্তরে বিভক্ত (নিম্ন, মধ্যম, উচ্চ, প্রত্যয়িত)। এই স্কেল গবেষক এবং ব্যবহারকারীদের মধ্যে মডেলের সহনশীলতা নিয়ে যোগাযোগ সহজ করে।
দুর্বলতা সূচক
বিপক্ষীয় আক্রমণের প্রতি একটি মডেলের সংবেদনশীলতা পরিমাপকারী পরিমাণগত মেট্রিক, যা আক্রমণের অধীনে অবনতিপ্রাপ্ত কর্মক্ষমতা এবং নামমাত্র কর্মক্ষমতার অনুপাত হিসাবে গণনা করা হয়। উচ্চ সূচক বৃহত্তর দুর্বলতা নির্দেশ করে যখন নিম্ন সূচক ভাল প্রতিরোধ ক্ষমতা নির্দেশ করে।
আক্রমণ সাফল্যের হার
যে নমুনাগুলোর জন্য একটি বিপক্ষীয় আক্রমণ মডেলের পূর্বাভাস পরিবর্তন করতে সক্ষম হয় তার শতাংশ, একটি নির্দিষ্ট মডেলের বিরুদ্ধে আক্রমণের কার্যকারিতা সরাসরি পরিমাপ করে। মডেলের নিরাপত্তা সম্পূর্ণভাবে মূল্যায়ন করার জন্য এই মেট্রিকটি রোবাস্ট একুরেসির পরিপূরক।
সর্বোচ্চ অনুমোদিত বিঘ্ন
পূর্বাভাস পরিবর্তন ছাড়াই একটি মডেল সহ্য করতে পারে এমন সর্বোচ্চ বিঘ্নের সীমা, যা নিয়ন্ত্রিত অবস্থায় সহনশীলতা মূল্যায়নের জন্য রেফারেন্স হিসেবে কাজ করে। মডেলের অপারেশনাল নিরাপত্তা সীমাবদ্ধতা সংজ্ঞায়িত করার জন্য এই পরিমাপ অপরিহার্য।
অনুভবিক সহনশীলতা মূল্যায়ন
একটি মডেলের প্রতিরোধ ক্ষমতা পরীক্ষা করার জন্য নির্দিষ্ট বিপক্ষীয় আক্রমণ তৈরি করার উপর ভিত্তি করে মূল্যায়ন পদ্ধতি, যা ব্যবহারিক পরিমাপ প্রদান করে কিন্তু আনুষ্ঠানিক গ্যারান্টি ছাড়া। এই পদ্ধতি ব্যাপকভাবে ব্যবহৃত হয় কারণ এটি বাস্তব আক্রমণ পরিস্থিতি প্রতিফলিত করে।
রোবাস্টবেঞ্চ বেঞ্চমার্ক
ইমেজ শ্রেণীবিভাগ মডেলগুলোর সহনশীলতা মূল্যায়নের জন্য প্রমিত রেফারেন্স প্ল্যাটফর্ম, যা কঠোর মূল্যায়ন প্রোটোকল এবং তুলনামূলক র্যাঙ্কিং প্রদান করে। রোবাস্টবেঞ্চ প্রত্যয়িত রোবাস্ট মডেলগুলোর একটি তালিকা এবং সম্প্রদায় দ্বারা স্বীকৃত মূল্যায়ন মেট্রিক্স বজায় রাখে।
Lp দূরত্ব মেট্রিক
বিপক্ষীয় বিঘ্নগুলোর মাত্রা পরিমাপ করতে ব্যবহৃত গাণিতিক নর্ম, যেখানে p বিভিন্ন মান (0, 1, 2, ∞) নিতে পারে বিভিন্ন ধরনের পরিবর্তন পরিমাপ করার জন্য। Lp নর্মের পছন্দ বিবেচনাধীন বিঘ্নগুলোর প্রকৃতি অনুযায়ী সহনশীলতার মূল্যায়নকে উল্লেখযোগ্যভাবে প্রভাবিত করে।
ফর্মাল রোবাস্টনেস ইভ্যালুয়েশন
একটি নির্দিষ্ট ডোমেইনে সম্ভাব্য সকল পার্টারবেশনের উপর গ্যারান্টি প্রমাণ করে মডেলের রোবাস্টনেস যাচাইয়ের গাণিতিকভাবে কঠোর পদ্ধতি। এম্পিরিক্যাল পদ্ধতির বিপরীতে, ফর্মাল ইভ্যালুয়েশন পরম নিশ্চয়তা প্রদান করে কিন্তু প্রায়শই কম্পিউটেশনালি ব্যয়বহুল।