🏠 Trang chủ
Benchmark
📊 Tất cả benchmark 🦖 Khủng long v1 🦖 Khủng long v2 ✅ Ứng dụng To-Do List 🎨 Trang tự do sáng tạo 🎯 FSACB - Trình diễn cuối cùng 🌍 Benchmark dịch thuật
Mô hình
🏆 Top 10 mô hình 🆓 Mô hình miễn phí 📋 Tất cả mô hình ⚙️ Kilo Code
Tài nguyên
💬 Thư viện prompt 📖 Thuật ngữ AI 🔗 Liên kết hữu ích
advanced

Strategi Penanganan Data Tidak Seimbang untuk Deteksi Penipuan

#machine-learning #data-science #imbalanced-data #fraud-detection #python

Membahas teknik advanced resampling dan metrik evaluasi untuk dataset fraud detection.

Bertindaklah sebagai Data Scientist yang berspesialisasi dalam keamanan finansial. Saya memiliki dataset transaksi keuangan dengan rasio kelas yang sangat ekstrem (99.9% transaksi valid, 0.1% penipuan). Metode standar seperti SMOTE atau Random Undersampling tidak memberikan hasil yang memuaskan. Pandu saya melalui: 1. Implementasi teknik lanjutan seperti ADASYN (Adaptive Synthetic Sampling) atau Cluster-based Undersampling dalam Python. 2. Penjelasan mengenai penggunaan 'Anomaly Detection' (seperti Isolation Forest atau Autoencoders) sebagai pendekatan alternatif untuk masalah klasifikasi biner ini. 3. Metrik evaluasi yang harus diprioritaskan selain akurasi (misalnya Precision-Recall AUC, Matthews Correlation Coefficient) dan alasannya. Berikan contoh pseudocode atau penjelasan logika algoritmanya dalam bahasa Indonesia.