🏠 Home
Benchmark
📊 Tutti i benchmark 🦖 Dinosauro v1 🦖 Dinosauro v2 ✅ App To-Do List 🎨 Pagine libere creative 🎯 FSACB - Ultimate Showcase 🌍 Benchmark traduzione
Modelli
🏆 Top 10 modelli 🆓 Modelli gratuiti 📋 Tutti i modelli ⚙️ Kilo Code
Risorse
💬 Libreria di prompt 📖 Glossario IA 🔗 Link utili
geavanceerd

Modelselectie voor Imbalanced Data

#data science #machine learning #statistiek #python

Bepaal de beste machine learning aanpak voor een dataset met een sterke klassenonevenwichtigheid.

Je werkt aan een fraudedetectiesysteem met een dataset die slechts 0,5% frauduleuze transacties bevat. Beschrijf waarom standaard nauwkeurigheid (accuracy) hier een misleidende metriek is. Kies twee geschikte evaluatiemetrics en leg uit waarom deze beter passen. Stel een pipeline voor die gebruikmaakt van SMOTE (Synthetic Minority Over-sampling Technique) of een vergelijkbare techniek in combinatie met een ensemble-model zoals XGBoost of Random Forest. Beschrijf de stappen om hyperparameters te tunen zonder data leakage.