प्रक्षेपवक्र भविष्यवाणी द्वारा सीखना
काल्पनिक अनुभव बफर
प्रशिक्षण के लिए मॉडल द्वारा उत्पन्न अनुकरणित पथ भंडारित करने वाली डेटा संरचना, जो पर्यावरण में एकत्रित वास्तविक अनुभव को पूरा करती है।
← पीछे