AI 용어집
인공지능 완전 사전
Vecteur de Valeur d'État Multi-Objectif
Représentation vectorielle où chaque composante correspond à la valeur estimée d'un état selon un objectif spécifique, permettant l'évaluation simultanée de multiples critères de performance.
Fonction de Valeur Multi-Objectif
Fonction mathématique qui associe à chaque paire état-action un vecteur de récompenses attendues, capturant les compromis entre différents objectifs contradictoires.
Hyperplan de Pareto
Sous-espace vectoriel dans l'espace des objectifs définissant la frontière entre les solutions dominées et non-dominées, servant de référence pour l'optimisation multi-objectif.
Front de Pareto
Ensemble des solutions efficaces où aucune amélioration d'un objectif ne peut se faire sans dégrader au moins un autre objectif, représentant l'optimalité multi-objectif.
Optimum de Pareto
État optimal dans un contexte multi-objectif où il est impossible d'améliorer un objectif sans détériorer au moins un autre objectif, caractérisant les solutions efficaces.
Opérateur d'Agrégation Linéaire
Opérateur mathématique combinant linéairement les valeurs de différents objectifs en utilisant des poids prédéfinis pour transformer un problème multi-objectif en problème scalaire.
Fonction de Scalarisation
Transformation mathématique convertissant un vecteur d'objectifs en une valeur scalaire unique, facilitant la comparaison et l'optimisation des solutions multi-objectifs.
Dilemme Exploration-Exploitation Multi-Objectif
Problème complexe où l'équilibre entre découvrir de nouvelles actions et exploiter les actions connues doit être géré simultanément pour tous les objectifs considérés.
Méthode de Pondération
Technique d'optimisation multi-objectif assignant des poids relatifs à chaque objectif pour guider la recherche vers des solutions spécifiques du front de Pareto.
Équilibre de Nash Multi-Objectif
Concept d'équilibre étendu aux jeux multi-objectifs où chaque agent optimise un vecteur d'utilités selon ses propres préférences tout en considérant les stratégies des autres.
Opérateur Tchebychev
Fonction d'agrégation utilisant la norme Tchebychev pour combiner les objectifs, privilégiant l'optimisation du pire objectif et garantissant l'atteinte de toute solution de Pareto.
Politique Stochastique Multi-Objectif
Stratégie de décision probabiliste où les probabilités d'action sont optimisées simultanément selon plusieurs objectifs, permettant une gestion flexible des compromis.
Matrice de Récompense Multi-Objectif
Structure de données stockant les récompenses vectorielles associées à chaque transition état-action, où chaque dimension correspond à un objectif spécifique.
Décomposition de la Fonction de Valeur
Technique consistant à décomposer la fonction de valeur vectorielle en sous-fonctions scalaires pour faciliter l'apprentissage et l'optimisation multi-objectif.
Méthode de Sélection Lexicographique
Approche d'optimisation ordonnant les objectifs par priorité absolue, où l'optimisation d'un objectif ne considère que les solutions optimales pour tous les objectifs précédents.
Hiérarchisation des Objectifs
Processus d'établissement d'une structure de priorités entre les différents objectifs pour guider l'optimisation vers des solutions alignées avec les préférences du décideur.
Convergence Multi-Objectif
Propriété d'un algorithme garantissant que les solutions générées convergent vers le front de Pareto ou un sous-ensemble de solutions efficaces au fil des itérations.
Stabilité Multi-Objectif
Capacité d'un algorithme d'apprentissage à maintenir des performances cohérentes sur tous les objectifs malgré les variations de l'environnement ou les perturbations.