Meta-Learning in RL
Outer Loop Optimization
Mise à jour des méta-paramètres en agrégeant les gradients de plusieurs tâches pour améliorer la capacité d'adaptation globale du modèle.
← RetourMise à jour des méta-paramètres en agrégeant les gradients de plusieurs tâches pour améliorer la capacité d'adaptation globale du modèle.
← Retour