Apprentissage par Dyna-Q
Dyna-Q+
Extension de Dyna-Q intégrant un mécanisme d'exploration basé sur le temps écoulé depuis la dernière visite d'état-action pour détecter et s'adapter aux changements environnementaux.
← Retour