Apprentissage par Prédiction de Trajectoires
Buffer d'expérience imaginaire
Structure de données stockant les trajectoires simulées générées par le modèle pour l'entraînement, complétant l'expérience réelle collectée dans l'environnement.
← Quay lại