টেম্পোরাল ডিফারেন্স শেখা
টিডি(λ) অ্যালগরিদম
টিডি পদ্ধতির একটি সাধারণীকরণ যা একটি যোগ্যতার ট্রেস ফ্যাক্টর λ ব্যবহার করে ভবিষ্যতের n-স্টেপ রিটার্নগুলিকে ওজন করে, টিডি(০) এবং মন্টে কার্লোর মধ্যে একটি অবিচ্ছিন্ন সমঝোতা প্রদান করে।
← ফিরে যান