अलग-अलग सीखना
एन-स्टेप टीडी
टेम्पोरल डिफरेंस अधिगम का सामान्यीकरण जो अद्यतन की गणना के लिए एन भविष्य के चरणों का उपयोग करता है, जो टीडी (0) और पूर्ण मॉन्टे कार्लो विधियों के बीच एक समझौता प्रस्तुत करता है।
← पीछे