advanced
معالجة مجموعات البيانات غير المتوازنة للاحتيال المالي
تطوير استراتيجية متقدمة للنمذجة التنبؤية عند مواجهة عدم التوازن الشديد في البيانات.
📝 محتوى الأمر
بصفتك عالم بيانات أول، أنت تتعامل مع مجموعة بيانات معاملات مالية حيث تمثل حالات الاحتيال 0.1% فقط من إجمالي البيانات. اشرح بالتفصيل خطواتك لبناء نموذج تعلم آلي قوي. يجب أن تغطي إجابتك: 1. تقنيات إعادة التشكيل (Resampling) مثل SMOTE وتأثيرها على البيانات الزائدة (Overfitting). 2. استخدام مقاييس التقييم المناسبة (مثل AUC-PR بدلاً من Accuracy). 3. استراتيجيات ضبط العتبة (Threshold Tuning) لتقليل الإيجابيات الكاذبة الخاطئة التي قد تزعج المستخدمين الشرعيين.