Réseaux de Neurones pour l'Optimisation Combinatoire
Q-Learning pour l'Optimisation Discrète
Algorithme d'apprentissage par renforcement basé sur les valeurs apprenant une fonction Q pour guider la sélection d'actions dans les espaces d'états discrets des problèmes combinatoires.
← Retour