Aprendizaje por Refuerzo Profundo
Asynchronous Advantage Actor-Critic (A3C)
Arquitectura distribuida donde múltiples agentes se entrenan en paralelo en copias del entorno, muestreando trayectorias decorrelacionadas y acelerando la convergencia.
← Volver