🏠 Início
Avaliações
📊 Todos os Benchmarks 🦖 Dinossauro v1 🦖 Dinossauro v2 ✅ Aplicações To-Do List 🎨 Páginas Livres Criativas 🎯 FSACB - Showcase Definitivo 🌍 Benchmark de Tradução
Modelos
🏆 Top 10 Modelos 🆓 Modelos Gratuitos 📋 Todos os Modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de Prompts 📖 Glossário de IA 🔗 Links Úteis
geavanceerd

Modelselectie voor Imbalanced Data

#data science #machine learning #statistiek #python

Bepaal de beste machine learning aanpak voor een dataset met een sterke klassenonevenwichtigheid.

Je werkt aan een fraudedetectiesysteem met een dataset die slechts 0,5% frauduleuze transacties bevat. Beschrijf waarom standaard nauwkeurigheid (accuracy) hier een misleidende metriek is. Kies twee geschikte evaluatiemetrics en leg uit waarom deze beter passen. Stel een pipeline voor die gebruikmaakt van SMOTE (Synthetic Minority Over-sampling Technique) of een vergelijkbare techniek in combinatie met een ensemble-model zoals XGBoost of Random Forest. Beschrijf de stappen om hyperparameters te tunen zonder data leakage.