🏠 होम
बेंचमार्क
📊 सभी बेंचमार्क 🦖 डायनासोर v1 🦖 डायनासोर v2 ✅ टू-डू लिस्ट ऐप्स 🎨 रचनात्मक फ्री पेज 🎯 FSACB - अल्टीमेट शोकेस 🌍 अनुवाद बेंचमार्क
मॉडल
🏆 टॉप 10 मॉडल 🆓 मुफ्त मॉडल 📋 सभी मॉडल ⚙️ किलो कोड
संसाधन
💬 प्रॉम्प्ट लाइब्रेरी 📖 एआई शब्दावली 🔗 उपयोगी लिंक
📖
डैगर डेटा एग्रीगेशन

DAgger (Dataset Aggregation)

इमिटेशन लर्निंग एल्गोरिथ्म जो पॉलिसी द्वारा दौरा किए गए राज्यों पर विशेषज्ञ से पूछकर पुनरावृत्त रूप से डेटा एकत्र करता है। यह दृष्टिकोण प्रशिक्षण वितरण और तैनाती वितरण के बीच के अंतर को कम करता है।

← पीछे