निरंतर बहु-उद्देश्य प्रबलित अधिगम
प्रेफरेंस-बेस्ड आरएल
एक दृष्टिकोण जहां उद्देश्यों के बीच समझौतों पर मानव वरीयताओं को एजेंट को पारेटो फ्रंट के वांछनीय समाधानों की ओर मार्गदर्शन करने के लिए सीखने की प्रक्रिया में एकीकृत किया जाता है।
← पीछे