Actor-Critic Methods
Asynchronous Advantage Actor-Critic
Arquitetura distribuída onde múltiplos agentes treinam em paralelo em ambientes independentes, compartilhando periodicamente seus gradientes para acelerar o aprendizado.
← Voltar