যোগ্যতার চিহ্ন
TD(λ) অ্যালগরিদম
একটি টেম্পোরাল-ডিফারেন্স লার্নিং অ্যালগরিদম যা যোগ্যতার ট্রেসের ক্ষয় নিয়ন্ত্রণকারী λ প্যারামিটারের মাধ্যমে TD(0) এবং মন্টে কার্লোর সুবিধাগুলি একত্রিত করে।
← ফিরে যান