Actor-Critic Methods
Asynchronous Advantage Actor-Critic
Architecture distribuée où plusieurs agents s'entraînent en parallèle sur des environnements indépendants, partageant périodiquement leurs gradients pour accélérer l'apprentissage.
← Retour