Agrégation de Données DAgger
DAgger (Dataset Aggregation)
Algorithme d'apprentissage par imitation qui collecte itérativement des données en interrogeant un expert sur les états visités par la politique actuelle. Cette approche réduit le décalage entre la distribution d'entraînement et la distribution de déploiement.
← Retour