Apprentissage par Renforcement pour l'Optimisation
Politique de Décision
Stratégie ou mapping qui définit l'action à entreprendre dans chaque état possible, représentant le comportement de l'agent dans un processus d'apprentissage par renforcement.
← Retour