মডেল এনসেম্বল শেখা
পোস্টেরিয়র প্রেডিক্টিভ ডিস্ট্রিবিউশন
ভবিষ্যতের স্টেট বা রিওয়ার্ডের উপর সম্পূর্ণ ডিস্ট্রিবিউশন যা মডেল প্যারামিটারের অনিশ্চয়তা এবং প্রক্রিয়া নয়েজ উভয়ই অন্তর্ভুক্ত করে, অনুশীলনে এনসেম্বল পূর্বাভাস দ্বারা আনুমানিক। RL-এ রোবাস্ট প্ল্যানিংয়ের জন্য মৌলিক।
← ফিরে যান