Aprendizaje Temporal Diferencial
Trazas de Elegibilidad
Mecanismo que mantiene una memoria a corto plazo de los estados o acciones visitados recientemente, permitiendo asignar crédito o responsabilidad de manera más eficiente en el aprendizaje por refuerzo.
← Volver