Aprendizaje mediante Dyna-Q
Generalización de modelo
Capacidad de extrapolar las predicciones del modelo a estados-acciones no observados, a menudo realizada por redes neuronales u otros aproximadores de función.
← Volver