Aprendizaje mediante Dyna-Q
Dyna-Q
Algoritmo híbrido de aprendizaje por refuerzo que combina el aprendizaje directo desde la experiencia real y la planificación utilizando un modelo aprendido para generar experiencias simuladas adicionales.
← Volver