रियल-टाइम रीइन्फोर्समेंट लर्निंग
स्ट्रीमिंग क्यू-लर्निंग
क्यू-लर्निंग एल्गोरिदम का एक संस्करण जो निरंतर डेटा प्रसंस्करण के लिए अनुकूलित है, जो नए अनुभव आने पर क्यू-वैल्यू तालिका को अपडेट करता है। यह विधि गैर-स्थिर वातावरण में अन्वेषण और दोहन के बीच संतुलन बनाए रखती है।
← पीछे