RL Multi-Objectifs Continu
Continuous Pareto Optimization
Optimisation continue du front de Pareto durant l'apprentissage, permettant à l'agent d'adapter dynamiquement ses compromis entre objectifs.
← Retour