قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
التحقق المتقاطع
تقنية تقييم تقسم البيانات إلى مجموعات فرعية لاختبار تعميم النموذج على عدة تكرارات.
اختبارات إحصائية
طرق إحصائية رسمية لمقارنة الأداء بشكل كبير بين نماذج أو تكوينات مختلفة.
مقاييس الأداء
مجموعة من المؤشرات الكمية (الدقة، الاستدعاء، درجة F1، MAE، RMSE) التي تقيس جودة التنبؤات حسب السياق.
تحليل التحيز-التباين
تحليل خطأ التعميم إلى تحيز (نقص التعلم) وتباين (إفراط في التعلم) لتحسين تعقيد النموذج.
اختبارات المتانة
تقييم استقرار التنبؤات في مواجهة الاضطرابات والضوضاء والتغيرات في بيانات الإدخال.
التحقق الزمني
منهجية خاصة بالبيانات المتسلسلة حيث يستخدم التدريب فترات سابقة للاختبار لمحاكاة الظروف الحقيقية.
منحنيات ROC و AUC
أدوات رسومية ومقاييس لتقييم أداء المصنفات الثنائية عند عتبات قرار مختلفة.
معايرة النماذج
تعديل الاحتمالات المتوقعة لتعكس بدقة الترددات الحقيقية لوقوع الأحداث.
اختبارات الإنصاف
تقييم التحيزات الديموغرافية والتمييز المحتمل للنموذج وفقًا للمعايير الأخلاقية والتنظيمية.
تحليل الأخطاء
فحص منهجي للتنبؤات غير الصحيحة لتحديد أنماط الفشل وتوجيه تحسين النموذج.
التحقق بواسطة بوتستراب
تقنية إعادة أخذ العينات مع الإحلال لتقدير التباين وموثوقية مقاييس الأداء.
اختبارات الإجهاد
تقييم سلوك النموذج في الظروف القصوى أو الحالات الهامشية لتحديد حدوده التشغيلية.
اختبارات الحساسية
تحليل تأثير التغيرات في خصائص الإدخال على التنبؤات لفهم استقرار النموذج.
التحقق الخارجي
اختبار النموذج على بيانات من مصادر أو توزيعات جديدة تمامًا لتقييم قدرته على التعميم.
اختبارات التدهور
المراقبة المستمرة لأداء النموذج في الإنتاج للكشف عن انحرافات البيانات والتدهور الزمني.