Apprentissage Temporel Différentiel
টিডি মান ফাংশন
অবস্থা বা ক্রিয়াকলাপের প্রত্যাশিত মানের পুনরাবৃত্তিমূলক অনুমান, যা সর্বোত্তম মান ফাংশনের কাছে পৌঁছানোর জন্য টেম্পোরাল ডিফারেন্স পদ্ধতি দ্বারা ক্রমাগত আপডেট করা হয়।
← ফিরে যান