MARL প্রতিপক্ষমূলক
মাল্টি-এজেন্ট প্রতিকূল ব্যান্ডিট
মাল্টি-আর্মড ব্যান্ডিট সমস্যার একটি সম্প্রসারণ যেখানে একাধিক এজেন্ট একটি পরিবেশে ইন্টারঅ্যাক্ট করে যেখানে পুরস্কারগুলি প্রতিকূলদের দ্বারা সম্ভাব্যভাবে ম্যানিপুলেট করা হয়।
← ফিরে যান