MARL Continu
Multi-Agent Partially Observable Markov Decision Process (MPOMDP)
Formalisation mathématique des environnements MARL où chaque agent possède des observations partielles et doit inférer l'état global pour prendre des décisions optimales.
← Retour