MARL Continu
MARL-এ ন্যাশ ইকুইলিব্রিয়াম
স্থিতিশীলতার ধারণা যেখানে কোনো এজেন্ট একতরফাভাবে তার কৌশল পরিবর্তন করে তার রিওয়ার্ড উন্নত করতে পারে না, যা প্রতিযোগিতামূলক MARL অ্যালগরিদমে কনভারজেন্স ক্রাইটেরিয়া হিসেবে ব্যবহৃত হয়।
← ফিরে যান