Deep Deterministic Policy Gradient (DDPG)
Actor Network
Réseau neuronal apprenant à mapper directement les états aux actions optimales dans un espace d'action continu.
← RetourRéseau neuronal apprenant à mapper directement les états aux actions optimales dans un espace d'action continu.
← Retour