Apprentissage par Dyna-Q
Généralisation de modèle
Capacité d'extrapoler les prédictions du modèle à des états-actions non observés, souvent réalisée par des réseaux de neurones ou d'autres approximateurs de fonction.
← Retour