Métodos Actor-Crítico
Asynchronous Advantage Actor-Critic
Arquitectura distribuida donde múltiples agentes se entrenan en paralelo en entornos independientes, compartiendo periódicamente sus gradientes para acelerar el aprendizaje.
← Volver