Meta-Aprendizaje en RL
Outer Loop Optimization
Actualización de los meta-parámetros agregando los gradientes de varias tareas para mejorar la capacidad de adaptación general del modelo.
← VolverActualización de los meta-parámetros agregando los gradientes de varias tareas para mejorar la capacidad de adaptación general del modelo.
← Volver