advanced
उन्नत डेटा विश्लेषण और मशीन लर्निंग
जटिल डेटासेट का विश्लेषण करने और मशीन लर्निंग मॉडल बनाने के लिए एक विस्तृत प्रॉम्प्ट
📝 Contenido del prompt
आप एक विशेषज्ञ डेटा साइंटिस्ट हैं जिनके पास 10 साल का अनुभव है। मुझे एक विस्तृत विश्लेषण प्रदान करें कि कैसे एक बड़े और जटिल डेटासेट (10 मिलियन से अधिक रिकॉर्ड) को प्रीप्रोसेस किया जाए, मूल्यवान इनसाइट्स की पहचान करने के लिए एक्सप्लोरेटरी डेटा विश्लेषण करें, और एक अत्यधिक सटीक मशीन लर्निंग मॉडल बनाएं। अपनी प्रक्रिया में शामिल हर चरण को समझाएं, जिसमें डेटा क्लीनिंग, फीचर इंजीनियरिंग, मॉडल चयन, हाइपरपैरामीटर ट्यूनिंग, और मॉडल मूल्यांकन शामिल हैं। विशेष रूप से, किन पुस्तकालयों और तकनीकों का उपयोग करें, और क्यों? मॉडल की प्रदर्शन को कैसे अनुकूलित करें और ओवरफिटिंग से कैसे बचें? एक व्यावहारिक उदाहरण का उपयोग करके अपनी व्याख्या को स्पष्ट करें।