advanced
उन्नत डेटा विश्लेषण और मशीन लर्निंग
जटिल डेटासेट का विश्लेषण करने और मशीन लर्निंग मॉडल बनाने के लिए एक विस्तृत प्रॉम्प्ट
📝 Prompt Content
आप एक विशेषज्ञ डेटा साइंटिस्ट हैं जिनके पास 10 साल का अनुभव है। मुझे एक विस्तृत विश्लेषण प्रदान करें कि कैसे एक बड़े और जटिल डेटासेट (10 मिलियन से अधिक रिकॉर्ड) को प्रीप्रोसेस किया जाए, मूल्यवान इनसाइट्स की पहचान करने के लिए एक्सप्लोरेटरी डेटा विश्लेषण करें, और एक अत्यधिक सटीक मशीन लर्निंग मॉडल बनाएं। अपनी प्रक्रिया में शामिल हर चरण को समझाएं, जिसमें डेटा क्लीनिंग, फीचर इंजीनियरिंग, मॉडल चयन, हाइपरपैरामीटर ट्यूनिंग, और मॉडल मूल्यांकन शामिल हैं। विशेष रूप से, किन पुस्तकालयों और तकनीकों का उपयोग करें, और क्यों? मॉडल की प्रदर्शन को कैसे अनुकूलित करें और ओवरफिटिंग से कैसे बचें? एक व्यावहारिक उदाहरण का उपयोग करके अपनी व्याख्या को स्पष्ट करें।