RL মাল্টি-অবজেক্টিভস কন্টিনিউ
পছন্দ-ভিত্তিক আরএল
একটি পদ্ধতি যেখানে উদ্দেশ্যগুলির মধ্যে ট্রেড-অফ সম্পর্কে মানুষের পছন্দগুলি শেখার প্রক্রিয়ায় সংহত করা হয়, যাতে এজেন্টকে প্যারেটো ফ্রন্টের কাঙ্খিত সমাধানের দিকে পরিচালিত করা যায়।
← ফিরে যান