ডাইনামিক প্রোগ্রামিং
মার্কভ সিদ্ধান্ত প্রক্রিয়া
মার্কভ বৈশিষ্ট্যসহ স্টোকাস্টিক পরিবেশে অনুক্রমিক সিদ্ধান্ত গ্রহণ মডেল করার জন্য গাণিতিক কাঠামো। একটি এমডিপি রাজ্যসমূহ, কর্মসমূহ, একটি রূপান্তর ফাংশন এবং একটি পুরস্কার ফাংশন দ্বারা সংজ্ঞায়িত।
← ফিরে যান