Q-learning
Apprentissage sans modèle
Approche où l'agent apprend directement la politique ou la fonction de valeur sans construire de modèle explicite de la dynamique de l'environnement.
← Wstecz