Apprentissage Temporel Différentiel
টিডি এরর
বর্তমান স্টেটের এস্টিমেটেড ভ্যালু এবং আপডেটেড টার্গেট ভ্যালুর মধ্যে পার্থক্য, যেখানে তাত্ক্ষণিক রিওয়ার্ড এবং পরবর্তী স্টেটের ভ্যালু এস্টিমেশন ব্যবহার করে টার্গেট ভ্যালু গণনা করা হয়।
← ফিরে যান