Aprendizaje mediante Dyna-Q
Dyna-Q+
Extensión de Dyna-Q que integra un mecanismo de exploración basado en el tiempo transcurrido desde la última visita estado-acción para detectar y adaptarse a los cambios ambientales.
← Volver