Policy Gradient Methods
Policy Gradient Theorem
Théorème fondamental fournissant une expression analytique du gradient du retour attendu par rapport aux paramètres de la politique, formulant la base théorique des méthodes.
← Retour