🏠 Início
Avaliações
📊 Todos os Benchmarks 🦖 Dinossauro v1 🦖 Dinossauro v2 ✅ Aplicações To-Do List 🎨 Páginas Livres Criativas 🎯 FSACB - Showcase Definitivo 🌍 Benchmark de Tradução
Modelos
🏆 Top 10 Modelos 🆓 Modelos Gratuitos 📋 Todos os Modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de Prompts 📖 Glossário de IA 🔗 Links Úteis
advanced

Strategi Penanganan Data Tidak Seimbang untuk Deteksi Penipuan

#machine-learning #data-science #imbalanced-data #fraud-detection #python

Membahas teknik advanced resampling dan metrik evaluasi untuk dataset fraud detection.

Bertindaklah sebagai Data Scientist yang berspesialisasi dalam keamanan finansial. Saya memiliki dataset transaksi keuangan dengan rasio kelas yang sangat ekstrem (99.9% transaksi valid, 0.1% penipuan). Metode standar seperti SMOTE atau Random Undersampling tidak memberikan hasil yang memuaskan. Pandu saya melalui: 1. Implementasi teknik lanjutan seperti ADASYN (Adaptive Synthetic Sampling) atau Cluster-based Undersampling dalam Python. 2. Penjelasan mengenai penggunaan 'Anomaly Detection' (seperti Isolation Forest atau Autoencoders) sebagai pendekatan alternatif untuk masalah klasifikasi biner ini. 3. Metrik evaluasi yang harus diprioritaskan selain akurasi (misalnya Precision-Recall AUC, Matthews Correlation Coefficient) dan alasannya. Berikan contoh pseudocode atau penjelasan logika algoritmanya dalam bahasa Indonesia.