MARL কেন্দ্রীয়-বিকেন্দ্রীকৃত
মাল্টি-এজেন্ট ডিপ ডিটারমিনিস্টিক পলিসি গ্রেডিয়েন্ট (MADDPG)
DDPG-এর মাল্টি-এজেন্ট পরিবেশে সম্প্রসারণ যা কেন্দ্রীভূত সমালোচক এবং বিকেন্দ্রীভূত অভিনেতা ব্যবহার করে কেন্দ্রীভূত-বিকেন্দ্রীভূত শেখার প্রয়োগ করে। প্রতিটি এজেন্ট অন্যান্য এজেন্টদের নীতিসমূহকে পরিবেশের অংশ হিসেবে বিবেচনা করে একটি নীতি শেখে।
← ফিরে যান