মাল্টি-এজেন্ট ডিপ ডিটারমিনিস্টিক পলিসি গ্রেডিয়েন্ট (MADDPG)

DDPG-এর মাল্টি-এজেন্ট পরিবেশে সম্প্রসারণ যা কেন্দ্রীভূত সমালোচক এবং বিকেন্দ্রীভূত অভিনেতা ব্যবহার করে কেন্দ্রীভূত-বিকেন্দ্রীভূত শেখার প্রয়োগ করে। প্রতিটি এজেন্ট অন্যান্য এজেন্টদের নীতিসমূহকে পরিবেশের অংশ হিসেবে বিবেচনা করে একটি নীতি শেখে।

← ফিরে যান