निरंतर बहु-उद्देश्य प्रबलित अधिगम
मल्टी-ऑब्जेक्टिव पॉलिसी ऑप्टिमाइज़ेशन
कई नीतियों या एक एकल नीति के समवर्ती अनुकूलन की प्रक्रिया जो विभिन्न उद्देश्यों के अनुरूप कई मूल्य कार्यों को अनुकूलित करने के लिए लक्षित है।
← पीछे