🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接
advanced

Strategi Penanganan Data Tidak Seimbang untuk Deteksi Penipuan

#machine-learning #data-science #imbalanced-data #fraud-detection #python

Membahas teknik advanced resampling dan metrik evaluasi untuk dataset fraud detection.

Bertindaklah sebagai Data Scientist yang berspesialisasi dalam keamanan finansial. Saya memiliki dataset transaksi keuangan dengan rasio kelas yang sangat ekstrem (99.9% transaksi valid, 0.1% penipuan). Metode standar seperti SMOTE atau Random Undersampling tidak memberikan hasil yang memuaskan. Pandu saya melalui: 1. Implementasi teknik lanjutan seperti ADASYN (Adaptive Synthetic Sampling) atau Cluster-based Undersampling dalam Python. 2. Penjelasan mengenai penggunaan 'Anomaly Detection' (seperti Isolation Forest atau Autoencoders) sebagai pendekatan alternatif untuk masalah klasifikasi biner ini. 3. Metrik evaluasi yang harus diprioritaskan selain akurasi (misalnya Precision-Recall AUC, Matthews Correlation Coefficient) dan alasannya. Berikan contoh pseudocode atau penjelasan logika algoritmanya dalam bahasa Indonesia.