Meta-reinforcement Learning
Inner Loop/Outer Loop
Structure d'optimisation à deux niveaux où la boucle interne adapte aux tâches spécifiques et la boucle externe méta-optimize les paramètres pour une meilleure adaptation.
← Retour