🏠 Strona Główna
Benchmarki
📊 Wszystkie benchmarki 🦖 Dinozaur v1 🦖 Dinozaur v2 ✅ Aplikacje To-Do List 🎨 Kreatywne wolne strony 🎯 FSACB - Ostateczny pokaz 🌍 Benchmark tłumaczeń
Modele
🏆 Top 10 modeli 🆓 Darmowe modele 📋 Wszystkie modele ⚙️ Kilo Code
Zasoby
💬 Biblioteka promptów 📖 Słownik AI 🔗 Przydatne linki
advanced

Strategi Penanganan Data Tidak Seimbang untuk Deteksi Penipuan

#machine-learning #data-science #imbalanced-data #fraud-detection #python

Membahas teknik advanced resampling dan metrik evaluasi untuk dataset fraud detection.

Bertindaklah sebagai Data Scientist yang berspesialisasi dalam keamanan finansial. Saya memiliki dataset transaksi keuangan dengan rasio kelas yang sangat ekstrem (99.9% transaksi valid, 0.1% penipuan). Metode standar seperti SMOTE atau Random Undersampling tidak memberikan hasil yang memuaskan. Pandu saya melalui: 1. Implementasi teknik lanjutan seperti ADASYN (Adaptive Synthetic Sampling) atau Cluster-based Undersampling dalam Python. 2. Penjelasan mengenai penggunaan 'Anomaly Detection' (seperti Isolation Forest atau Autoencoders) sebagai pendekatan alternatif untuk masalah klasifikasi biner ini. 3. Metrik evaluasi yang harus diprioritaskan selain akurasi (misalnya Precision-Recall AUC, Matthews Correlation Coefficient) dan alasannya. Berikan contoh pseudocode atau penjelasan logika algoritmanya dalam bahasa Indonesia.