MARL Centralizado-Descentralizado
Gradiente de Política Determinística Profunda Multiagente (MADDPG)
Extensão do DDPG para ambientes multiagentes usando aprendizado centralizado-descentralizado com críticos centralizados e atores descentralizados. Cada agente aprende uma política considerando as políticas dos outros agentes como parte do ambiente.
← Voltar