Policy Gradient Methods
Deterministic Policy Gradient
Extension du policy gradient aux espaces d'action continus où la politique est déterministe, particulièrement efficace dans les environnements à haute dimensionalité.
← Retour