মডেল-ভিত্তিক গভীর RL
মডেল প্রেডিক্টিভ কন্ট্রোল (এমপিসি)
একটি কন্ট্রোল কৌশল যা শেখা মডেল ব্যবহার করে একটি সীমিত সময়ের দিগন্তে ভবিষ্যতের ক্রিয়াগুলির একটি ক্রম অপ্টিমাইজ করে, প্রতিটি সময় ধাপে সর্বোত্তম পরিকল্পনা অবিচ্ছিন্নভাবে পুনর্মূল্যায়ন করে।
← ফিরে যান