Distributional Reinforcement Learning
Expected Value Approximation
Méthode traditionnelle en RL qui se concentre uniquement sur l'estimation de l'espérance mathématique des retours futurs. Cette approche néglige la variance et les moments supérieurs de la distribution des retours.
← Quay lại