🏠 Home
Prestatietests
📊 Alle benchmarks 🦖 Dinosaur v1 🦖 Dinosaur v2 ✅ To-Do List applicaties 🎨 Creatieve vrije pagina's 🎯 FSACB - Ultieme showcase 🌍 Vertaalbenchmark
Modellen
🏆 Top 10 modellen 🆓 Gratis modellen 📋 Alle modellen ⚙️ Kilo Code
Bronnen
💬 Promptbibliotheek 📖 AI-woordenlijst 🔗 Nuttige links
geavanceerd

Modelselectie voor Imbalanced Data

#data science #machine learning #statistiek #python

Bepaal de beste machine learning aanpak voor een dataset met een sterke klassenonevenwichtigheid.

Je werkt aan een fraudedetectiesysteem met een dataset die slechts 0,5% frauduleuze transacties bevat. Beschrijf waarom standaard nauwkeurigheid (accuracy) hier een misleidende metriek is. Kies twee geschikte evaluatiemetrics en leg uit waarom deze beter passen. Stel een pipeline voor die gebruikmaakt van SMOTE (Synthetic Minority Over-sampling Technique) of een vergelijkbare techniek in combinatie met een ensemble-model zoals XGBoost of Random Forest. Beschrijf de stappen om hyperparameters te tunen zonder data leakage.