MARL Continu
Stochastic Games
Extension des MDP aux environnements multi-agents où les transitions et les récompenses dépendent des actions conjointes de tous les agents, modélisant des scénarios coopératifs et compétitifs.
← Retour