रियल-टाइम रीइन्फोर्समेंट लर्निंग
गैर-स्थिर सुदृढ़ीकरण सीख
एक सैद्धांतिक ढांचा जो उन वातावरणों से संबंधित है जहां संक्रमण संभावनाएं और पुरस्कार समय के साथ विकसित होते हैं। विशेष एल्गोरिदम इन वितरण परिवर्तनों का लगातार पता लगाते हैं और उनके अनुकूल होते हैं।
← पीछे