MARL Contínuo
Gradiente de Política Determinística Profunda Multiagente (MADDPG)
Algoritmo CTDE que estende o DDPG para ambientes multiagentes, utilizando críticos centralizados e atores descentralizados para aprender em espaços de ação contínuos.
← Voltar