क्यू-लर्निंग
एप्सिलॉन में कमी
एप्सिलॉन-ग्रीडी नीति में ε पैरामीटर को क्रमिक रूप से कम करने की रणनीति जो प्रारंभिक अन्वेषण और अंतिम उपयोग को प्रोत्साहित करने के लिए होती है।
← पीछेएप्सिलॉन-ग्रीडी नीति में ε पैरामीटर को क्रमिक रूप से कम करने की रणनीति जो प्रारंभिक अन्वेषण और अंतिम उपयोग को प्रोत्साहित करने के लिए होती है।
← पीछे