মাল্টি-এজেন্ট ডিপ ডিটারমিনিস্টিক পলিসি গ্রেডিয়েন্ট (MADDPG)

একটি CTDE অ্যালগরিদম যা DDPG-কে মাল্টি-এজেন্ট পরিবেশে প্রসারিত করে, যেখানে কেন্দ্রীয় সমালোচক এবং বিকেন্দ্রীভূত অভিনেতা ব্যবহার করে ক্রমাগত অ্যাকশন স্পেসে শেখা হয়।

← ফিরে যান