मल्टी-एजेंट डीप डिटरमिनिस्टिक पॉलिसी ग्रेडिएंट (MADDPG)

एक सीटीडीई एल्गोरिदम जो डीडीपीजी को मल्टी-एजेंट वातावरण तक विस्तारित करता है, निरंतर क्रिया स्थानों में सीखने के लिए केंद्रीकृत आलोचकों और विकेंद्रीकृत अभिनेताओं का उपयोग करता है।

← पीछे