🏠 Strona Główna
Benchmarki
📊 Wszystkie benchmarki 🦖 Dinozaur v1 🦖 Dinozaur v2 ✅ Aplikacje To-Do List 🎨 Kreatywne wolne strony 🎯 FSACB - Ostateczny pokaz 🌍 Benchmark tłumaczeń
Modele
🏆 Top 10 modeli 🆓 Darmowe modele 📋 Wszystkie modele ⚙️ Kilo Code
Zasoby
💬 Biblioteka promptów 📖 Słownik AI 🔗 Przydatne linki
geavanceerd

Modelselectie voor Imbalanced Data

#data science #machine learning #statistiek #python

Bepaal de beste machine learning aanpak voor een dataset met een sterke klassenonevenwichtigheid.

Je werkt aan een fraudedetectiesysteem met een dataset die slechts 0,5% frauduleuze transacties bevat. Beschrijf waarom standaard nauwkeurigheid (accuracy) hier een misleidende metriek is. Kies twee geschikte evaluatiemetrics en leg uit waarom deze beter passen. Stel een pipeline voor die gebruikmaakt van SMOTE (Synthetic Minority Over-sampling Technique) of een vergelijkbare techniek in combinatie met een ensemble-model zoals XGBoost of Random Forest. Beschrijf de stappen om hyperparameters te tunen zonder data leakage.