ऑफलाइन मल्टी-टास्क रीइन्फोर्समेंट लर्निंग
मल्टी-टास्क ऑफलाइन एक्सप्लोरेशन-एक्सप्लॉइटेशन
ऑफलाइन कॉन्टेक्स्ट के लिए एडाप्टेड डाइलेमा जहाँ मल्टीपल टास्क्स के लिए एक्जिस्टिंग डेटा के यूज़ और कंट्रोल्ड एक्सट्रपोलेशन के बीच बैलेंस मैनेज किया जाता है।
← पीछे