Aprendizaje por Aprendizaje Activo
Modelo Directo
Modelo predictivo que estima el siguiente estado y la recompensa dado el estado actual y la acción, fundamental para la planificación en el aprendizaje por refuerzo.
← Volver