Glossario IA
Il dizionario completo dell'Intelligenza Artificiale
Apprentissage par Imitation à Observations Partielles
Sous-domaine de l'apprentissage par imitation où l'agent apprend à partir de démonstrations d'experts tout en ne disposant que d'une vue partielle ou bruitée de l'environnement, ce qui complique la généralisation du comportement.
Inférence d'État Latent
Processus visant à estimer les variables d'état non observables de l'environnement à partir des observations partielles, souvent réalisé via des modèles probabilistes ou des réseaux de neurones pour reconstruire un état complet.
Modèle de Transition d'État
Modèle mathématique qui prédit l'évolution de l'état latent de l'environnement en fonction des actions de l'agent, essentiel pour anticiper les conséquences des actions dans un cadre à observations partielles.
Apprentissage par Renforcement Inverse à Observations Partielles
Variante de l'apprentissage par renforcement inverse où la fonction de récompense est inférée à partir de démonstrations, mais en tenant compte du fait que l'agent ne perçoit qu'une partie de l'état, ce qui biaise l'estimation des récompenses.
Généralisation à Observations Inconnues
Capacité d'une politique apprise par imitation à performer correctement lorsqu'elle fait face à des configurations d'observations partielles jamais vues pendant l'entraînement, un défi clé pour la robustesse du modèle.
Modèle de Perception
Composant du système d'apprentissage qui transforme les observations bruitées ou partielles en une représentation plus riche et exploitable pour la prise de décision, souvent un réseau de neurones profond.
Apprentissage par Imitation Comportemental
Approche qui se concentre sur la modélisation directe de la politique de l'expert (mapping observation-action) sans tenter de reconstruire l'état latent, adaptée aux contextes où la modélisation de l'environnement est trop complexe.
Débruitage d'Observations
Technique de traitement du signal ou d'apprentissage profond visant à nettoyer les observations partielles ou bruitées avant de les fournir à l'agent, afin d'améliorer la qualité de la prise de décision.
Alignement de Trajectoires Latentes
Processus de mise en correspondance des trajectoires d'états latentes inférées par l'agent avec les trajectoires réelles (mais inconnues) de l'expert, crucial pour évaluer et corriger le modèle de perception.
Apprentissage par Imitation Robuste
Paradigme visant à apprendre une politique qui performe bien même en présence de fortes incertitudes sur les observations, souvent via des techniques d'entraînement adversarial ou de régularisation.
Modèle Générateur de Démonstrations
Modèle, souvent un GAN ou un VAE, entraîné à générer des trajectoires d'observations et d'actions réalistes, utilisé pour augmenter les données d'entraînement et améliorer la généralisation dans les contextes à observations partielles.
Erreur de Perception-Action
Type d'erreur spécifique où une mauvaise interprétation d'une observation partielle conduit à une action inappropriée, un indicateur clé pour diagnostiquer les faiblesses d'un système d'apprentissage par imitation.
Apprentissage par Imitation Multi-Agents à Observations Partielles
Extension du domaine où plusieurs agents doivent apprendre à coopérer ou à compétitionner en imitant des experts, chacun avec sa propre vue partielle de l'environnement, ajoutant une complexité d'interaction.
Calibration de l'Incertitude
Entraînement d'un modèle à quantifier de manière fiable son propre manque de confiance face à des observations ambiguës, permettant à l'agent d'adopter des comportements plus prudents ou de demander de l'aide.