Meta-Learning in RL
Inner Loop Optimization
Processus d'adaptation rapide des paramètres du modèle sur une tâche spécifique en utilisant quelques gradients steps pendant le meta-learning.
← Retour