ऑफलाइन मल्टी-टास्क रीइन्फोर्समेंट लर्निंग
मल्टी-टास्क बैच कंस्ट्रेंड क्यू-लर्निंग
बीसीक्यू का मल्टी-टास्क संदर्भ में विस्तार, जहां क्यू फ़ंक्शन बैच डेटा द्वारा सीमित होता है, साथ ही कार्यों के बीच ज्ञान साझा करता है।
← पीछे