RL Multi-Objectifs Continu
Vector Reward Function
Fonction de retour qui renvoie un vecteur de récompenses au lieu d'un scalaire, permettant de capturer simultanément plusieurs objectifs conflictuels dans l'apprentissage par renforcement.
← Retour