कल्पना द्वारा सीख
काल्पनिक पथ
पर्यावरण के अपने आंतरिक मॉडल का उपयोग करके एजेंट द्वारा अनुकरणित स्थिति-कार्य-पुरस्कार अनुक्रम। ये आभासी पथ बिना किसी जोखिम या वास्तविक लागत के वैकल्पिक नीतियों का अन्वेषण करने की अनुमति देते हैं।
← पीछे