Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Apprentissage par Imitation Multimodal
Paradigme d'apprentissage où l'agent apprend à partir de démonstrations présentant plusieurs solutions valides pour une même tâche, capturant la diversité des comportements experts.
Distribution de Politiques Multimodales
Représentation probabiliste d'une politique contenant plusieurs modes distincts, chacun correspondant à une stratégie de résolution différente pour atteindre le même objectif.
Mode d'Action
Configuration comportementale spécifique au sein d'une distribution multimodale, représentant une manière distincte et cohérente d'exécuter une tâche.
Agrégation de Démonstrations
Processus de combinaison intelligente de trajectoires d'apprentissage provenant de différentes stratégies pour construire une politique unifiée préservant la multimodalité.
Mélange de Gaussiennes pour Politiques
Modèle paramétrique représentant une politique multimodale comme une combinaison pondérée de plusieurs distributions gaussiennes, chaque gaussienne correspondant à un mode comportemental.
Posterior de Trajectoire
Distribution conditionnelle sur les trajectoires possibles étant donné un état initial et l'objectif, capturant l'incertitude sur les différentes manières d'atteindre la cible.
Espace Latent Comportemental
Représentation compressée où chaque point encode une stratégie comportementale distincte, permettant la navigation et l'interpolation entre différents modes d'action.
Clustering de Démonstrations
Technique de regroupement automatique des trajectoires similaires pour identifier et isoler les différents modes comportementaux présents dans les données d'imitation.
Découplage Modalité-Action
Architecture où la sélection du mode comportemental et la génération d'actions spécifiques sont traitées par des composants séparés pour une meilleure modélisation multimodale.
Inférence de Mode
Processus d'identification du mode comportemental approprié à utiliser dans une situation donnée, basé sur le contexte et les préférences de l'agent.
Politique Conditionnelle
Politique qui génère des actions conditionnées à la fois par l'état actuel et par un identifiant de mode sélectionné, permettant un contrôle explicite de la stratégie adoptée.
Sélection de Solution Optimale
Mécanisme évaluant et choisissant la meilleure solution parmi plusieurs alternatives valides basé sur des critères comme l'efficacité, la robustesse ou les contraintes contextuelles.
Variance Comportementale
Mesure statistique quantifiant la dispersion des actions ou trajectoires autour de chaque mode, distinguant la variabilité intra-mode de la multimodalité.
Fusion de Modes
Technique combinant plusieurs modes comportementaux pour créer de nouvelles stratégies hybrides, exploitant les forces de chaque mode individuel.
Apprentissage de Sous-politiques
Approche où chaque mode est modélisé comme une sous-politique spécialisée, apprise indépendamment avant d'être intégrée dans une architecture multimodale globale.
Hiérarchie de Solutions
Structure organisationnelle des différentes solutions valides, souvent basée sur leur complexité, efficacité ou contexte d'application optimal.
Exploration Guidée par Mode
Stratégie d'exploration qui maintient la cohérence avec un mode comportemental sélectionné tout en découvrant de nouvelles variations valides au sein de ce mode.
Transfert Inter-modal
Capacité de transférer des connaissances acquises dans un mode comportemental pour améliorer l'apprentissage ou l'exécution dans un autre mode similaire.
Évaluation Multimodale
Métrique d'évaluation prenant en compte non seulement la performance moyenne mais aussi la couverture et la qualité des différents modes comportementaux appris.