🏠 Trang chủ
Benchmark
📊 Tất cả benchmark 🦖 Khủng long v1 🦖 Khủng long v2 ✅ Ứng dụng To-Do List 🎨 Trang tự do sáng tạo 🎯 FSACB - Trình diễn cuối cùng 🌍 Benchmark dịch thuật
Mô hình
🏆 Top 10 mô hình 🆓 Mô hình miễn phí 📋 Tất cả mô hình ⚙️ Kilo Code
Tài nguyên
💬 Thư viện prompt 📖 Thuật ngữ AI 🔗 Liên kết hữu ích
Hard

고차원 희소 데이터를 위한 머신러닝 파이프라인 최적화

#machine-learning #data-engineering #python #optimization

결측치가 많고 불균형한 대규모 데이터 세트를 처리하는 엔드투엔드 ML 파이프라인을 구축합니다.

데이터 과학자로서, 결측치가 40% 이상이고 클래스 불균형이 심한 추천 시스템 데이터를 분석해야 합니다. 데이터 전처리(Imputation), 차원 축소, 그리고 SMOTE 등의 리샘플링 기법을 적용한 머신러닝 파이프라인을 구상하십시오. 또한 모델의 성능을 평가할 때 정확도(accuracy) 대신 어떤 지표를 사용해야 하는지 설명하십시오.