🏠 Accueil
Benchmarks
📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction
Modèles
🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code
Ressources
💬 Prompts IA 📖 Glossaire IA 🔗 Liens Utiles
geavanceerd

Modelselectie voor Imbalanced Data

#data science #machine learning #statistiek #python

Bepaal de beste machine learning aanpak voor een dataset met een sterke klassenonevenwichtigheid.

Je werkt aan een fraudedetectiesysteem met een dataset die slechts 0,5% frauduleuze transacties bevat. Beschrijf waarom standaard nauwkeurigheid (accuracy) hier een misleidende metriek is. Kies twee geschikte evaluatiemetrics en leg uit waarom deze beter passen. Stel een pipeline voor die gebruikmaakt van SMOTE (Synthetic Minority Over-sampling Technique) of een vergelijkbare techniek in combinatie met een ensemble-model zoals XGBoost of Random Forest. Beschrijf de stappen om hyperparameters te tunen zonder data leakage.