मॉडल-आधारित गहन प्रबलित सीख
वर्ल्ड मॉडल
पर्यावरण का एक पूर्ण तंत्रिका प्रतिनिधित्व जो एजेंट को एक अनुकरित स्थान में तर्क करने के लिए सिस्टम की गतिशीलता, अदृश्य स्थितियों और पुरस्कारों को एक साथ सीखता है।
← पीछे