Meta-Aprendizaje en RL
Inner Loop Optimization
Proceso de adaptación rápida de los parámetros del modelo en una tarea específica utilizando algunos pasos de gradiente durante el meta-aprendizaje.
← Volver