Deep Deterministic Policy Gradient (DDPG)
Neural Network Function Approximation
Utilisation de réseaux neuronaux pour approximer des fonctions complexes comme les politiques ou les fonctions de valeur en apprentissage par renforcement.
← Retour