🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles
advanced

Strategi Penanganan Data Tidak Seimbang untuk Deteksi Penipuan

#machine-learning #data-science #imbalanced-data #fraud-detection #python

Membahas teknik advanced resampling dan metrik evaluasi untuk dataset fraud detection.

Bertindaklah sebagai Data Scientist yang berspesialisasi dalam keamanan finansial. Saya memiliki dataset transaksi keuangan dengan rasio kelas yang sangat ekstrem (99.9% transaksi valid, 0.1% penipuan). Metode standar seperti SMOTE atau Random Undersampling tidak memberikan hasil yang memuaskan. Pandu saya melalui: 1. Implementasi teknik lanjutan seperti ADASYN (Adaptive Synthetic Sampling) atau Cluster-based Undersampling dalam Python. 2. Penjelasan mengenai penggunaan 'Anomaly Detection' (seperti Isolation Forest atau Autoencoders) sebagai pendekatan alternatif untuk masalah klasifikasi biner ini. 3. Metrik evaluasi yang harus diprioritaskan selain akurasi (misalnya Precision-Recall AUC, Matthews Correlation Coefficient) dan alasannya. Berikan contoh pseudocode atau penjelasan logika algoritmanya dalam bahasa Indonesia.