বিতরণকৃত মাল্টি-এজেন্ট পরিকল্পনা
বহু-এজেন্ট রিইনফোর্সমেন্ট লার্নিং পরিকল্পনার জন্য
এমন শিক্ষণ অ্যালগরিদমের ব্যবহার যেখানে প্রতিটি এজেন্ট পরিবেশ এবং অন্যান্য এজেন্টদের সাথে মিথস্ক্রিয়া করে একটি পরিকল্পনা নীতি (গতিপথ নির্বাচন) শেখে, যাতে সম্মিলিত বা ব্যক্তিগত পুরস্কার সর্বাধিক করা যায়।
← ফিরে যান