इम्प्लिसिट क्यू-लर्निंग (आईक्यूएल)
बैच-सीमित अनुकूलन
IQL में रणनीति जो सीखी गई कार्यों को डेटासेट में देखी गई कार्यों के करीब रहने के लिए बाधित करती है ताकि अविश्वसनीय एक्सट्रपोलेशन से बचा जा सके।
← पीछे