Scalabilité en MARL
QMIX Algorithm
Algorithme de Q-learning multi-agent garantissant la monotonie entre les valeurs individuelles et la valeur jointe, permettant un apprentissage stable dans des systèmes de grande taille.
← Retour