MARL Continuo
Gradiente de Política Determinística Profunda Multiagente (MADDPG)
Algoritmo CTDE que extiende DDPG a entornos multiagente, utilizando críticos centralizados y actores descentralizados para aprender en espacios de acción continuos.
← Volver