MARL प्रतिकूल
स्व-खेल
प्रशिक्षण की एक पद्धति जहाँ एक एजेंट विकसित होने वाली रणनीतियों के साथ खुद की प्रतिलिपियों के खिलाफ प्रतिस्पर्धा करके सीखता है, बाहरी डेटा की आवश्यकता को समाप्त करता है।
← पीछे