Optimisation Évolutionnaire Multi-Objectifs
Policy Gradient Multi-Objectifs
Méthode d'apprentissage par renforcement optimisant directement les paramètres de politique pour maximiser un vecteur de récompenses multi-objectifs utilisant des techniques de gradient stochastique.
← Retour