Q-Learning Multi-Objectifs
Reward Vector
Vecteur de récompenses multidimensionnel où chaque composant correspond à la récompense associée à un objectif spécifique, remplaçant le signal de récompense scalaire traditionnel.
← Retour