ऑफलाइन मल्टी-टास्क रीइन्फोर्समेंट लर्निंग
मल्टी-टास्क डिस्ट्रीब्यूशनल आरएल
एक फ्रेमवर्क जो ऑफलाइन मल्टी-टास्क संदर्भ में प्रत्येक कार्य के लिए रिटर्न की अपेक्षा के बजाय उनके पूर्ण वितरण को मॉडल करता है।
← पीछे