Apprentissage par Imitation en Un Seul Tir

📖

termes

One-shot Imitation Learning

Paradigme d'apprentissage où un agent acquiert la capacité d'exécuter une nouvelle tâche après avoir observé une seule démonstration, sans nécessiter d'entraînement supplémentaire spécifique à cette tâche.

📖

termes

Contextual Policy

Fonction de politique conditionnelle qui prend en entrée à la fois l'état actuel de l'environnement et le contexte de la démonstration observée pour générer des actions appropriées.

📖

termes

Demonstration Encoding

Processus de transformation d'une séquence de démonstration en une représentation sémantique qui peut être utilisée par le modèle pour guider l'exécution de la tâche imitée.

📖

termes

Behavior Cloning from Demonstration

Technique d'apprentissage supervisé où le modèle apprend directement à mapper les états aux actions en imitant le comportement expert à partir d'exemples démonstratifs.

📖

termes

Episode-based Learning

Méthode d'entraînement où les tâches sont présentées sous forme d'épisodes complets, comprenant démonstration et phase d'exécution, pour faciliter l'apprentissage de l'imitation en un seul tir.

📖

termes

Cross-domain Imitation

Capacité d'imiter des tâches même lorsque les démonstrations proviennent de domaines légèrement différents ou présentent des variations contextuelles importantes.

📖

termes

Trajectory Alignment

Processus d'ajustement spatial et temporel entre la trajectoire de démonstration et la trajectoire d'exécution pour assurer une imitation précise malgré les variations initiales.

📖

termes

Latent Task Representation

Espace latent où les tâches sont encodées de manière abstraite, permettant la capture des invariants structurels et la généralisation à de nouvelles instances de tâches.

📖

termes

Zero-shot Generalization

Extension du one-shot learning où le modèle peut performer sur des tâches jamais vues même sans démonstration, en s'appuyant sur les similarités structurelles apprises.

📖

termes

Conditional Neural Process

Architecture neurale stochastique capable de modéliser des distributions sur les fonctions, particulièrement adaptée pour l'apprentissage à partir de peu d'exemples en imitation.

📖

termes

Hierarchical Imitation

Structure d'apprentissage multi-niveaux où les tâches complexes sont décomposées en sous-tâches plus simples, facilitant l'imitation à partir de démonstrations uniques.

Glossaire IA

One-shot Imitation Learning

Contextual Policy

Demonstration Encoding

Behavior Cloning from Demonstration

Episode-based Learning

Cross-domain Imitation

Trajectory Alignment

Latent Task Representation

Zero-shot Generalization

Conditional Neural Process

Hierarchical Imitation

Aucun résultat trouvé