Curiosity-Driven RL
Variational Information Maximization Exploration (VIME)
Méthode d'exploration qui maximise l'information mutuelle entre les paramètres du modèle et les observations futures, utilisant des approches bayésiennes pour quantifier l'incertitude.
← Retour