Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
One-shot Imitation Learning
Paradigme d'apprentissage où un agent acquiert la capacité d'exécuter une nouvelle tâche après avoir observé une seule démonstration, sans nécessiter d'entraînement supplémentaire spécifique à cette tâche.
Contextual Policy
Fonction de politique conditionnelle qui prend en entrée à la fois l'état actuel de l'environnement et le contexte de la démonstration observée pour générer des actions appropriées.
Demonstration Encoding
Processus de transformation d'une séquence de démonstration en une représentation sémantique qui peut être utilisée par le modèle pour guider l'exécution de la tâche imitée.
Behavior Cloning from Demonstration
Technique d'apprentissage supervisé où le modèle apprend directement à mapper les états aux actions en imitant le comportement expert à partir d'exemples démonstratifs.
Episode-based Learning
Méthode d'entraînement où les tâches sont présentées sous forme d'épisodes complets, comprenant démonstration et phase d'exécution, pour faciliter l'apprentissage de l'imitation en un seul tir.
Cross-domain Imitation
Capacité d'imiter des tâches même lorsque les démonstrations proviennent de domaines légèrement différents ou présentent des variations contextuelles importantes.
Trajectory Alignment
Processus d'ajustement spatial et temporel entre la trajectoire de démonstration et la trajectoire d'exécution pour assurer une imitation précise malgré les variations initiales.
Latent Task Representation
Espace latent où les tâches sont encodées de manière abstraite, permettant la capture des invariants structurels et la généralisation à de nouvelles instances de tâches.
Zero-shot Generalization
Extension du one-shot learning où le modèle peut performer sur des tâches jamais vues même sans démonstration, en s'appuyant sur les similarités structurelles apprises.
Conditional Neural Process
Architecture neurale stochastique capable de modéliser des distributions sur les fonctions, particulièrement adaptée pour l'apprentissage à partir de peu d'exemples en imitation.
Hierarchical Imitation
Structure d'apprentissage multi-niveaux où les tâches complexes sont décomposées en sous-tâches plus simples, facilitant l'imitation à partir de démonstrations uniques.