निरंतर बहु-उद्देश्य प्रबलित अधिगम
निरंतर परेटो अनुकूलन
सीखने के दौरान परेटो फ्रंट का निरंतर अनुकूलन, जिससे एजेंट को लक्ष्यों के बीच समझौतों को गतिशील रूप से अनुकूलित करने की अनुमति मिलती है।
← पीछे