Deep RL Multi-Objectifs
PPO Multi-Objectifs
Adaptation de l'algorithme Proximal Policy Optimization pour les environnements multi-objectifs, optimisant simultanément plusieurs fonctions objectif. L'algorithme maintient des contraintes de proximité tout en explorant l'espace des compromis entre objectifs.
← Zurück