ডাইনামিক প্রোগ্রামিং
মান ফাংশন
একটি নির্দিষ্ট নীতি অনুসরণ করে একটি প্রদত্ত অবস্থা থেকে প্রত্যাশিত ক্রমবর্ধমান পুরস্কার অনুমান করে এমন ফাংশন। এটি একটি নির্দিষ্ট অবস্থায় থাকার দীর্ঘমেয়াদী উপযোগিতা উপস্থাপন করে।
← ফিরে যান