Aprendizaje por Refuerzo Jerárquico
Función de Terminación
Función que determina cuándo una opción debe detenerse y devolver el control al nivel superior, crucial para la coordinación temporal entre los niveles jerárquicos.
← Volver